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Programme : 


Cours 1: Penser/Traduire : definitions. 

Cours 2 : La representation « objective » du monde. 

Cours 3 : Comment decrire le monde ? 

I. L'utilisation de la methode experimentale. 

II. Matiere a penser: etat de I'art dans un domaine scientifique. 

Cours 4 : Le langage de I'ADN : Conservation, transmission et traduction de I'information genetique 
Cours 5 : La reinterpretation des donnees et le changement de cadre conceptuel. Les bases de I'unite 
et de la diversite du vivant, concept d'espece et arbres phylogenetiques. 

Cours 6 : Diversite genetique et code barre moleculaire. 

Cours 7 : Genetique et ethique. 

Cours 8 : Les faux semblants. 

I. Evaluation statistique de la similarite et de la difference. 

II. Reflexions autour de la correlation et du lien de causalite. 

III. Homologie et analogie. La convergence evolutive aux differents niveaux d'integration du 

vivant. 

Cours 9 : Experimentation animale et medecine. 

I. Les quatre etapes de la cruaute. 

II. Specisme, anthropocentrisme, biocentrisme et ecocentrisme 

III. Modeles animaux et experimentations. 


Modalites de contrdle des connaissances : 2 controles en continu (12 octobre et 15 decembre) 
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Cours 1: Penser/Traduire, definitions 


CONCEPT 

Idee generale et abstraite que se fait I'esprit humain d'un objet de pensee concret ou abstrait, et qui 
lui permet de rattacher a ce meme objet les diverses perceptions qu'il en a, et d'en organiser les 
connaissances. 

Un concept est une idee generale qui permet de regrouper toute la diversite d'un objet autour d'une 
meme unite de pensee, pour mieux la manipuler. Prenons par exemple le concept de I'amour: c'est 
une idee generale, abstraite qui ne peut se definir en dehors de toutes les experiences particulieres 
et subjectives de ce concept. Autrement dit, meme si chacun a sa « vision » de I'amour, tout le 
monde I'experimente et connait tous les elements qui permettent de penser I'amour. 

CADRE CONCEPTUEL 

Un cadre conceptuel est un outil d'analyse comptant plusieurs variations et contextes. II est utilise 
pour faire des distinctions conceptuelles et organiser des idees. Les cadres conceptuels forts 
saisissent quelque chose de reel et le font d'une maniere facile a retenir et a appliquer. Le terme 
« cadre conceptuel » s'emploie a la fois selon I'echelle (grandes et petites theoriques) et les 
contextes (sciences sociales, marketing, science appliquee, art, etc.). Sa definition et son application 
explicites peuvent done varier. 

Les cadres conceptuels sont particulierement utiles comme organisation de dispositifs dans la 
recherche empirique. Un certain nombre de chercheurs appliquent la notion de cadre conceptuel a la 
recherche empirique deductive. 

Ilya plusieurs types de cadres conceptuels et ils se conferment tous a un but de recherche : 
hypothese de travail, exploration ou recherche exploratoire (une recherche a caractere 
d'exploration), categorie descriptive (la classification des plantes de Carl Von Linne par exemple), 
description ou recherche descriptive (recherche dont le caractere ou le but est de decrire), type 
d'idee pratique, analyse, modeles de recherche operationnelle, prise de decision, hypothese 
formelle, explication et prediction. 

Un cadre conceptuel est I'outil que nous employons pour mettre en ordre, organiser, penser 
le materiau brut de notre recherche (donnees, observations empiriques, references...). C'est le 
terreau de la recherche en ce sens ou il va permettre la creation, I'articulation et la bonne croissance 
de notre recherche. Le ou les cadres conceptuels veillent a I'avancee de la recherche pour mettre en 
exergue et resoudre les difficultes rencontrees, paradoxes, apories ou toute situation a 
interpretation. 

VISION DU MONDE 

La vision du monde designe, en philosophie, en psychologie sociale, I'ensemble des representations 
metaphysiques, physiques et sociales qui orientent I'action des etres humains. 

La vision du monde est I'ensemble des racines, des noyaux durs de notre connaissances du 
monde. Ce sont toutes les croyances fondamentales, presuppositions, et axiomes que I'on a sur le 
monde et notre existence. La vision du monde est une experience subjective, unique et dirige nos 
actions. C'est parce que je me fais telle idee sur le monde que je vais agir de sorte. Par exemple, si je 
pense que dans le monde, les forts ecrasent les faibles, je vais faire en sorte d'ecraser autrui et tout 
mes potentiels rivaux pour pouvoir faire partie de la categorie des forts, categorie la plus apte a la 
survie car elle ne subit aucune action negative selon ma vision du monde. 
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PENSER 

TRADUIRE 

Du latin pensare (peser, soupeser) 

• Considerer quelque chose comme vrai 
(ou non), comme probable (ou non). 

• Considerer quelqu'un, quelque chose 
comme etant tels (Je le pensais 
diplomate.). 

• Avoir telle ou telle opinion sur tel sujet. 

• Avoir la conviction de quelque chose, le 
croire. 

• Avoir I'intention de, projeter. 

• Faillir, manquer (Elle pensa s'evanouir). 

• Se dire interieurement. 

• Comprendre, deduire. 

• Concevoir quelque chose dans ses 
moindres details avant de le realiser. 

Svnonvmes : admettre, croire, estimer, 
imaginer, juger, conjecturer, esperer, se figurer, 
supposer, elaborer, etudier, examiner, murir, 
ordonnancer, penetrer, regler 

Du latin traducere, « faire passer d'un point a 
un autre » 

• Transposer un discours, un texte, 
I'exprimer dans une langue differente 

• Exprimer un sentiment, une pensee, les 
rendre sensibles 

Svnonvmes : Transposer, manifester, montrer, 
reveler, trahir, convoquer (traduire quelqu'un 
en justice). 


Comment ces termes peuvent s'articuler dans le domaine des sciences ? 

Penser en sciences, c'est considerer quelque chose comme vrai (ou non) ou comme etant tels, avoir 
la conviction de, le croire ; au travers d'une comprehension, d'une deduction, d'une conception dans 
ses moindres details. 

Traduire en sciences, c'est exprimer, rendre intelligible, interpreter, modeliser et idealiser le monde 
qui nous entoure grace a I'activite de notre cerveau afin de se le representer dans ses moindres 
details et de partager avec les autres son interpretation. 

Ilya done un passage entre individus/cerveaux et done une trahison possible ! 
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Cours 2 : La representation « objective » du monde 


^Peut-on avoir une representation « objective » du monde ? 

Document 1: Le corbeau et ^interpretation differentielle (video) 

De prime abord, le corbeau semble eloigne de nous, semble avoir moins d'importance. Cependant il 
possede une capacite a memoriser et decortiquer les differentes etapes d'un probleme pour le 
resoudre. Faculte que I'on pensait jusque la uniquement possible chez le cerveau humain. Moins un 
etre vivant est capable de faire demonstration d' « intelligence » (ou autrement dit, de mimer nos 
capacites d'actions et de reflexions), moins nous allons lui accorder une valeur intrinseque dans le 
jeu complexe de la vie. L'experience du corbeau montre qu'il est capable d'utiliser des outils pour 
saisir des objets, qui eux-memes vont servir a actionner un mecanisme complexe pour faire parvenir 
la nourriture. C'est un outilleur fin insoup^onne. 

Document 2 : Citation de Nietzsche sur le reve 

« C'est en effet grace a deux etats que I'homme conquiert la sensation d'exister, le reve et I'ivresse. 

La belle apparence du monde des reves, au sein duquel tout homme est pleinement artiste, est la 
mere de tout art plastique... » Friedrich Nietzsche, La vision dionysiaque du monde. 

Pour Nietzsche, le reve et I'ivresse permettent de transcender la realite pour veritablement 
exister. Ces deux modalites d'etre permettent de s'affranchir d'une realite ascese et aride pour 
s'accomplir en tant qu'artiste. En effet, I'art permet a I'homme de s'accomplir lui-meme, I'art donne 
a I'homme la capacite de devenir un « surhomme » c'est-a-dire celui qui jouit de son etre de maniere 
pleine et entiere. Une representation « objective » du monde n'est pas ce qui importe a priori. C'est 
paradoxalement par le reve et I'ivresse que I'on peut accomplir de la maniere la plus compile et 
objective, son humanite. 

Document 3 : L'addiction ou la verite modifiee. Nuggets, court metrage d'animation d'Andreas 
Hykade(2014) 

Synopsis du site « Sens Critique » : « Un petit oiseau, une sorte de kiwi ou de pingouin trouve une 
jolie pepite doree. En I'avalant, il s'envole dans les airs avec delectation. Mais tandis que notre oiseau 
continue sa quete de pepites, a la poursuite de ce premier etat de volupte, son univers s'assombrit 
peu a peu. Au fur et a mesure, il s'envole de moins en moins haut et sa chute devient de plus en plus 
dure... » 

Le court-metrage parle du processus de l'addiction et de son probleme : de la curiosite a 
I'extase pourfinir par le besoin destructeur. Si les « pepites » permettent au protagoniste d'acceder 
a un monde pus agreable, meilleur et superieur, leur effet devient de moins en moins fort. En 
s'enfon^ant dans I'accoutumance, le protagoniste modifie sa realite. Pour lui, le monde reel devient 
un cauchemar et c'est inlassablement qu'il va revenir vers les « pepites » pour retrouver un monde 
meilleur qu'il va prendre pour sa realite. 

Document 4 : Interpretation et falsification (Journal televise de France 3, 19h, 15 Decembre 
2018, accusation de falsification d'image) 

Aux premiers abords, sans connaitre le contexte de I'image, on pense a une manifestation de 
soutient sans la pancarte compile. En realite, I'image a ete modifiee et le « degage » a ete enleve de 
la pancarte « Macron degage ». 
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Ilya done une falsification de la pensee par falsification du reel. La trahison n'a pas lieu dans 
^interpretation des donnees mais par les donnees elles-memes qui sont incompIMes ou falsifiees. A 
part des donnees du reel ou fabriquees, notre cerveau va penser et traduire des donnees pour diriger 
nos actions. 

Document 5 et 6: Le developpement des animaux et les generations successives (Theorie de 
la preformation, 1694, Essai de diotrique, Nicolas Hartsoeker et etude de I'embryologie (formation de 
I'embryon de poulet) par Marcello Malpighi (1673)). 

La theorie de la preformation est une theorie formulee au XVIIIeme siecle pour expliquer le 
developpement embryonnaire par le deploiement de structures deja existantes dans I'oeuf, a la 
maniere de poupees russes. Deux modeles s'affrontent: I'ovisme (I'embryon est preforme dans la 
femelle) et I'animalculisme (I'embryon est preforme dans le spermatozoide). Hartsoeker se situe 
dans ce dernier modele avec le concept d'« homoncule ». II imagine un foetus entier qui pouvait se 
loger dans la tete du spermatozoide, comme une replique miniature. 

Malpighi explique la formation de I'embryon de poulet comme le resultat de plusieurs couches 
cellulaires qui vont se developper et former I'embryon. Ces couches sont presentes dans I'oeuf et 
vont juste continuer a se former petit a petit. Tandis que Hartsoeker etait partisan de la theorie de la 
preformation, Malpighi etait plus proche de sa theorie rivale, I'epigenese. Cette theorie du XVIIIeme 
siecle stipule que I'embryon se developpe petit a petit de maniere complexe en rapport avec son 
environnement. 

Que retenir de ces deux theories ? Qu'il est difficile d'avoir une representation objective du monde. 
Nous pouvons uniquement s'approcher au mieux de la verite des choses par le biais de 
comparaisons, metaphores ou liens forces selon nos capacites d'observation du reel et nos 
connaissances actuelles. 

Document 7 et 8 : Experience reelle versus simulation numerique (simulation de larve de poisson 
zebre) 

De fa^on generale, la simulation numerique est un outil qui permet d'etudier les resultats d'une 
action sur un element sans realiser I'experience sur I'element reel. Cette solution alternative permet 
de lever divers problemes de la realisation de I'experience reelle et de prevoir les resultats. Quelle 
que soit la qualite de la simulation, elle ne remplace pas totalement ^experimentation. Une 
simulation numerique est utile pour la prediction et devaluation, a la condition qu'il existe une 
reproductibilite acceptable entre le modele numerique et le modele reel. 

La simulation numerique reproduit ce que I'on est capable d'observer, I'observation permet 
d'optimiser la simulation numerique. La simulation numerique necessite la mise en equation du reel. 
Cette mise en equation devrait nous permettre d'utiliser le modele numerique afin d'obtenir des 
parametres chiffres supplementaires de ceux obtenus avec I'experience reelle. 


Conclusion generale : Peut-on plaider une representation objective du monde ? Au regard des 
nombreux paramMres qui faussent notre pensee, il semble a priori que non : reves, ivresse, 
jugements de valeurs, prejuges, connaissances limites, biais cognitifs, specisme, realite modifiee, 
interpretation, falsification...Cependant, il semble que la mise en equation du reel puisse permettre 
d'approcher au maximum une representation « objective » du monde. 





Cours 3 : Comment decrire le monde ? 


I. La methode experimentale 


La methode experimentale s'effectue dans le cadre d'une recherche empirique deductive. La 
recherche empirique peut etre definie comme « la recherche basee sur I'experimentation ou 
I'observation (evidence) » (Claude Bernard, 1865). Ce type de recherche est mene avec I'objectif de 
tester une hypothese. 

Nous pouvons schematiser la methode experimentale ainsi : 

(Modele theorique ^ Prediction) 

Observations^Question^Hypothese^...^ Experience(s) ^Resultat(s) ^Confrontation a 
l'hypothese^Conclusion(s). 

Un raisonnement deductif part d'une idee generale, d'un principe, d'une loi pour en tirer une 
consequence particuliere. Pour discuter le raisonnement, on peut analyser la valeur de la loi 
generale, reperer si le fait particulier entre bien dans le domaine de la loi generale. 

Un raisonnement inductif part d'un ou de plusieurs faits particuliers pour en tirer un principe, une 
loi, une idee generale. Ce raisonnement est inverse au precedent. Pour discuter le raisonnement, on 
analyse la pertinence de I'extension du fait particulier a un ensemble plus vaste. 

II. Matiere a penser: etat de I'art dans un domaine scientifique= I'art de I'exhaustivite : 
encyclopedies bibliographiques et biologiques et outils informatiques. 

Aucune recherche, aussi originale soit-elle, n'est isolee par rapport a un signifiant. Elle se 
rattache toujours a un contexte de sens. Le cadre conceptuel a pour but de cerner cet ensemble 
ideal (theories, lois, concepts, donnees scientifiques). 

Que la recherche soit entreprise pour apporter un eclairage nouveau sur une question, pour 
construire un corpus explicatif, pour approfondir une analyse, dans tous les cas, elle fait progresser 
la connaissance sous un aspect ou dans un domaine inedit. 

Avant de decouvrir et d'affirmer qu'il s'agit bien d' « inedit », le chercher doit faire le point sur le 
sujet qu'il etudie, explorer le champ (intellectuel) ou il veut travailler, considerer les constructions 
theoriques deja enoncees dans le domaine. Sa demarche debute par une recherche documentaire 
tres vaste puis par une analyse de cette documentation a partir de laquelle il batit un cadre 
conceptuel. 

1) La collecte de la documentation 

a. Recenser les sources d'informations bibliographiques. 

Elies doivent etre consultees systematiquement en partant des plus recentes. Le chercheur releve les 
auteurs, les documents qui I'interessent. Ceux qui retiennent son attention sont fiches. II peut 
consulter les publications, livres, periodiques, textes legislatifs, publications administratives, theses, 
memoires, traductions, statistiques, annales, documents professionnels, photographies, films... 
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b. Cerner I'information 


Cette operation est particulierement delicate car il convient pour le chercheur de se procurer une 
bibliographie a la talle de sa problematique. Mais ou cela s'arrete-t-il ? II peut s'appuyer sur son 
hypothese de recherche pour en extraire des mots-cles et proceder a une sorte de thesaurus. 

« Les thesaurus sont des langages controles constitues de « Descripteurs » mots ou expressions, 
pouvant se combiner entre eux » 

C'est un outil documentaire ou un mot cle renvoie a un certain nombre d'autres termes. Cette 
operation permet egalement de preciser le sens de chaque signifiant et d'eviter la polysemie 
(caractere d'un signe qui possede plusieurs contenus, plusieurs sens...). 

Cerner I'information revient a la selectionner, a rechercher ce qui est inedit, original, a laisser tomber 
les travaux qui ne sont que paraphrase, a ecarter les pistes secondaires, mais aussi a ne rien oublier 
de ce qui a deja ete ecrit sur le sujet. 

c. Exploiter I'information 

Tous les documents consultes ne sont pas memorises d'emblee. Ceux qui retiennent I'interet du 
chercheur sont condenses, c'est-a-dire qu'il extrait I'information utile contenu dans le document et 
en fait un resume (abstract) qui I'aidera pour la memorisation. Les abstracts sont classes par themes 
ou mots cles. Chacun a une methode qui lui est propre pour classer cette information. 

Quand la bibliographie a ete fructueuse, le chercheur se trouve en face d'une importante quantite de 
materiaux. II peut etre submerge par le nombre et la diversite des documents. Un tri s'impose pour 
Sexploitation. Les appreciations et critiques, faites lors de la lecture, permettent de classer la 
bibliographie par la valeur que le chercheur lui donne : essentiel, tres important, a ne pas negliger..., 
a mettre si je n'ai rien trouve d'autre etc... 

Cette methode implique au prealable, une « lecture intelligente », c'est-a-dire que les axes definis 
dans servent d'objectif de lecture. 

d. Analyser I'information 

Cette phase de la documentation prepare le cadre conceptuel de la recherche. Le chercheur est 
amene a se poser des questions : ai-je acquis des connaissances, qui orientent differemment la 
recherche ? Ai-je bien apporte un eclairage sur tous les aspects de la recherche ? 

Pour trouver des elements de reponse, il analyse sa documentation, fait des liens et des 
regroupements, met en evidence les contradictions, les courants de pensees, d'idees opposees, 
precede une critique des textes, etc... Cela est possible quand il a rassemble suffisamment de 
materiaux. Le fait meme de les collecter (les textes) en un ensemble qui lui est inedit, fait surgir un 
champ sur lequel vous pourrez reflechir, argumenter, attester ou contester. 

Ce temps d'analyse sert egalement a retenir les citations d'auteurs qui renforcent les idees que le 
chercheur soutient. II n'est pas question de faire une compilation de tous les textes lus, mais de faire 
emerger, en les regroupant, les concepts, theoriques qui vont etayer le cadre conceptuel. 


2) Le cadre conceptuel 

On appelle, cadre conceptuel, I'ensemble des connaissances, theoriques, qui ont un apport 
quelconque avec le sujet de la recherche. 





Ces elements vont servir de points de reperes et devenir cadre theorique ou encore ils peuvent etre 
un ideal a atteindre et devenir cadre philosophique. 


Dans les premieres etapes, de cadre conceptuel oriente, enrichit la problematique. II feconde les 
hypotheses pour leur donner toute I'envergure de leur signification, mais rien que leur signification. 

II determine I'idee ou les idees directrices. II est le lieu de I'articulation de sens contenu dans les 
variables. II ne procure pas d'explication aux phenomenes, mais il aide a leur comprehension en 
donnant acces a des references connues, lois et theories. 

Des le debut de la recherche, le cadre conceptuel a une function d'organisation, dans le sens ou il 
oriente la demarche de pensee et la logique des differentes etapes. Au cours du travail, le chercheur 
teste la validite conceptuelle de la recherche. II va faire reference au cadre conceptuel qu'il a bati. 
Pour mettre en evidence un nouveau concept, une nouvelle connaissance, il doit analyser les 
relations que celui-ci entretient avec les lois, theoriques et phenomenes connus. On ne fait 
progresser le savoir qu'en construisant, a partir de connaissances existantes, une demarche 
d'analyse adequate. 

Dans les dernieres etapes, le cadre conceptuel est indispensable pour evaluer les resultats. On peut 
lui comparer les contenus significatifs recueillis par les outils de recherche et ayant deja ete soumis a 
une premiere etude. Plus le cadre conceptuel est adapte et complet, plus I'analyse est fine et subtile. 
II n'y a pas de recherche valable sans cette double confrontation de I'hypothese, puis de I'analyse au 
cadre conceptuel. Le travail sur le reel implique toujours une position theorique scientifique de 
depart. 

a. Histoire simplifiee des banques de donnees biologiques et bibliographiques 

Une banque de donnees biologique est la collecte, le stockage et ^organisation de la connaissance 
biologique. Les donnees sont associees avec les informations biologiques et sont utilisees a I'aide 
d'interfaces informatiques utilisateurs conviviales. 

Deux types de banques de donnees biologiques : 

Banques de donnees primaires: elles contiennent les informations, par exemple, de 
sequences nucleotidiques ou proteiques, accompagnees des informations d'annotations a 
propos de leur function, de la bibliographie, et des references croisees avec d'autres banques 
de donnees, etc... 

Banques de donnees secondaires: elle resume les resultats des analyses des banques de 
donnees primaires de sequence des proteines. Le but de ces analyses est d'obtenir des 
proprietes communes pour des classes de sequences, qui a leur tour permettent la 
classification de sequences inconnues (annotation). De plus, toutes les autres banques de 
donnees qui sauvegarde de I'information biologique ou medicale exempli gratia (par 
exemple) banques de donnees bibliographiques, sont frequemment classees comme 
banques de donnees secondaires. 

Developpement d'Internet, du WWW et de I'usage des ordinateurs : 

• Creation d'Internet: 1969. L'ARPA (Advanced Research Project Agency) cree sous la 
gouverne du Ministre de la Defense des Etats Unis, un reseau de communication entre 
ordinateurs, I'ARPANET. Sa propriete est qu'un defaut sur une partie du reseau ne remet pas 
en cause le fonctionnement de la totalite du reseau. Deux protocoles sont utilises pour faire 
fonctionner le reseau : 


9 




Le TCP (Transmission Control Protocol) et TIP (Internet Protocol). Internet ce sont les reseaux 
connectes entre eux par les protocoles de communication TCP/IP/ 

• Le premier ordinateur personnel est mis sur le marche par IBM en 1981. 

• Le World Wide Web (WWW) se developpe entre 1990 et 1991 avec Tim Berners-Lee, du 
CERN). Deux services dominent alors I'internet: WWW et I'e-mail (invente en 1971 par 
Thomlinson). Ces services sont supportes par un protocole de communication, le FTP (File 
Transfer Protocol), developpe initialement pour le transfert de donnees scientifiques. 

Les moteurs de recherche moderne (Internet Explorer, Mozilla Firefox utilisent les protocoles 
http mais egalement FTP et ont permis le developpement de plateformes de communication. 

De la genomique associee a la bio-informatique : 

• Le premier algorithme de comparaison de sequences de proteines ou d'ADN a ete publie par 
Needleman et Wunsch en 1970. 

• Le terme bio-informatique a ete invente en 1978 par Flogeweh et definie comme « studies of 
informatic processes in biotic systems » (les etudes des processus informatiques dans des 
systemes biotiques (relatif aux etres vivants et a leur action)). 

• La PDB (Brookhaven Protein Data Bank) a ete cree en 1971. La PDB est une banque de 
donnees pour le stockage des donnees cristallographique des proteines. 

• En 1977, Sanger et Al developpent une methode de sequen^age de I'ADN (enzymation chain 
termination procedure). La publication de la sequence compile du virus bacteriophage 
FX174 en 1980 coincide avec la premiere utilisation du premier ensemble de programme 
designes pour I'analyse des sequences des proteines et des ADNs (IntelliGeneticsSuite). 

• Smith et Watermann publient un autre algorithme de comparaison de sequences en 1981. 

• En 1982, la banque de donnee publique GenBank est creee. 2000 sequences deposees en fin 
1983. 

• Creation en 1982 du Genetics Computer Group (University of Winconsin ) avec la mise au 
point de packages pour la biologie moleculaire nomme Wisconsin Suite. IntelliGenetics Suite 
et Wisconsin Suite etaient utilises par lignes de commande. Le descendant actuel du WS est 
disponible sous le nom Accelys GCG. 

• En 1986, Mullis et ses collegues publient le principe du PCR (Polymerase Chain Reaction), qui 
represente une etape cle en biologie moleculaire. 

• Creation en 1986 de la banque de donnees SWISS-PROT et du terme « genomique » qui 
decrit une discipline scientifique relative au sequen^age et a la description de genomes 
entiers 

• Creation en 1988 du NCBI (National Center for Biotechnology Information) a partir duquel 
sont heberges, encore aujourd'hui, les banques de donnees les plus importantes. La meme 
annee debute le « Fluman Genome Initiative » et est publie I'algorithme FASTA 

• 1991, G. Venter publie I'utilisation des « Expressed Sequence Tags » (ESTs) 

• 1992, Venter et Fraser fondent le TIGR (The Institute for Genomics Research) 

• 1994, publication d'un outil integre d'analyse de sequence (GeneQuiz) qui a ete utilise en 
1996 pour la premiere analyse automatique des plus de 6000 proteines deduites de I'analyse 
de la sequence complete du genome de la levure de boulanger Sacchoromyces cerevisiae. 

• 1996, Bairoch et ses collegues annoncent le debut de la banque de donnees « Prosite ». 

• 1997, LION Biosciences AG est fonde a Heidelberg en Allemagne et utilise comme base le 

package GeneQuiz pour son produit phare, le package d'analyse de sequence bioSCOUT puis 
developpe le package Sequence-Retrieval System (SRS). 
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• 1997 et 1998 sont des annees charnieres en bio-informatique et en biologie moleculaire du 
fait que les sequences completes du genome de deux especes modeles importantes ont ete 
publies, Caenorhabditis elegans et Saccharomyces cerevisiae. 

• En 2000, la societe Metalife AG en Allemagne est cree et developpe une banque de donnee 
semantique nommee BioExplorer. II combine les banques de donnees primaires et 
secondaires, ce qui permet a I'utilisateur d'extraire uniquement les informations pertinentes 
et non redondantes. La sequence du genome de deux autres especes modeles majeures sont 
mises a disposition : Arabidopsis thaliana et Drosophila melanogaster. 

• 2001, la premiere version brute du genome humain est publiee et est completee en 2004. 

• Une sequence brute du genome de la souris Mas musculus (responsable de la malaria 
humaine) en 2002, le moustique Anopheles gambiae, le rat Rattus norvegivus (2004) et le 
chimpanze Pan troglodytes (2005). 

• En 2008, lancement du projet 1000 genomes pour etablir le catalogue des variations 
genetiques humaines le plus detaille. La phase pilote du projet est terminee, le sequen^age 
de plus de 2000 genomes est en cours. 

• Entre 2009 et 2010, les chercheurs utilisent massivement le sequen^age de la partie 
exprimee (fonctionnelle) du genome. Ce sequen^age d'exomes (exon versus intron 
(intragenic region)) permet la decouverte rapide des variants alleliques et des mutations. 

• En 2012, une annotation fonctionnelle du genome humain est publiee. 

• En 2016, la sequence de 10 000 genomes humaines set publiee avec un niveau eleve de 
couverture (30X a 40X). 

b. Banques de donnees bibliographiques (PubMed, Google Scholar, Research Gate) 

Ces banques de donnees permettent de trouver des articles scientifiques rapidement et maniere 
intelligente. 

Pour PubMed par exemple, nous pouvons chercher des sujets d'articles, des auteurs d'articles et trier 
selon nos besoins. II est possible d'avoir les informations des auteurs et le texte complet pour chaque 
article. On peut egalement avoir le texte en PDF disponible au telechargement. 

c. Banques de donnees biologiques et leur utilisation 

On remarque que le developpement de la banque de donnees GenBank, hebergee par le NCBI, est 
exponentiel. En effet, on passe en dix ans de presque rien a 10 milliards de donnees pour atteindre 6 
ans plus tard 70 milliards. De 1982 jusqu'a aujourd'hui, le nombre de donnees dans GenBank a 
double tout les 18 mois. Aujourd'hui on atteint des chiffres que I'esprit humain ne peut concevoir et 
acquerir. 

Dans le Genome Project, on peut trouver des sequences nucleotidiques pour plus de 300 000 
organismes avec des annotations bibliographiques et biologiques. 

Un exemple de systems generalists : les bases de donnees du NCBI. GenBank est une banque de 
donnees de sequences biologiques (genomes/genes, nucleotides, proteines). Si je cherche une 
proteine, je trouverais toutes fiches avec I'apparition de cette proteine. 

https://www.ncbi.nlm.nih.gov/ 
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Un exemple de systeme specialise : ENSEMBL (genomes) 


II est connecte au NCBI et on peut trouver des genomes et des chromosomes et leur localisation chez 
les especes. 

http://www.ensembl.org/index.html 

Un autre exemple de systeme specialise : les banques de donnees taxonomiques (necessaires pour 
rattacher une sequence biologique a I'organisme vivant dont elle est issue. Depuis le site de la NCBI 
on peut avoir des fiches taxonomiques sur les etres vivants. Le site http://tolweb.org/tree est un site 
qui permet de retrouver le placement d'une espece dans un arbre phylogenique. 


d. Rechercher dans une banque de donnees de sequences biologiques 

Identifier les sequences qui vont servir a faire un alignement multiple pour eventuellement 
reconstruire une histoire evolutive. Exemple : Utilisation de I'outil BLAST. 

Comment trouver une sequence homologue a ma sequence requete parmi toutes les sequences 
connues ? Sachant qu'il y a 82 853 685 sequences... 

^Premiere solution : aligner toutes les sequences avec I'algorithme de comparaison de Smith et 
Watermann ou Needleman & Wunsch. L'avantage est de trouver la sequence la plus similaire. 
L'inconvenient est que cela dure 132 jours. La programmation dynamique donne un resultat exact. 

^Deuxieme solution : faire une pre-selection sur les sequences et les aligner avec S&W. L'avantage 
est un resultat rapide et efficace. L'inconvenient est que I'on risque de louper la « perle rare ». C'est 
le processus qu'utilise BLAST, un processus heuristique. 

L'heuristique (du grec heuriskein « trouver ») est I'utilisation de regies empiriques pratiques, 
simples, rapides, facilitants la recherche des faits et I'analyse de situations soit dans un objectif de 
resolution de problemes et de prise de decision soit dans un domaine particulier. 

Les heuristiques trouvent leur place dans les algorithmes qui necessitent I'exploration d'un grand 
nombre de cas car elles permettent de reduire leur complexite moyenne en examinant d'abord les 
cas qui ont le plus de chances de donner la reponse. Le choix d'une telle heuristique suppose de 
connaTtre deja certaines proprietes statistiques sur I'ensemble d'instances du probleme que I'on 
s'apprete a resoudre. 

^Alors comment pre-selectionner les sequences ? 

Supposons une sequence avec un mot de longueur k tel que : 

ma sequence ^ k ^ 

- .\A.\.\.\ 1 - 

i - 

une sequence 
dans SwissProt 

Premiere idee : ne retenir que les sequences partageant au moins un mot de longueur k avec ma 
sequence. 
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Cette preselection est rapide car toutes les sequences de SwissProt sont indexees c'est-a-dire qu'on 
determine pour tous les mots de longueur k, la liste des sequences qui contiennent ce mot. SI I'on 
change la valeur de k, la preselection change. 

Plus la taille k est grande, plus le critere est strict. Cependant, on risque de passer a cote de 
sequences homologues. 

Si la taille k est trop petite, le critere n'est pas assez selectif. On risque d'avoir trop de sequences 
candidates. 

^Comment faire ? 

On applique un double critere : les sequences doivent partager 2 petits mots au lieu d'un grand. On 

peut faire trouver 2 paires de mots voisins a egale distance d dans les 2 sequences tel que : 

d 

ma sequence < - > 

-— ^ FKL 


une autre sequence 

j Pk\ 


d 


» _ 

^ \’DF 1 = 


Un premier score de similarity est etabli. 

Ensuite, on verifie que I'on peut etendre ces amorces pour obtenir des alignements sans gaps de 
score de similarity. 

Enfin on fait un alignement local Smith et Watermann. 

La mythode S&W tel que 1 syquence contre tout UniProt dure 5 jours. 

La mythode heuristique BLAST tel que 1 syquence contre tout UniProt dure quelques secondes. 
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Cours 4 : Le langage de I'ADN. Conservation, transmission et traduction de I'information 

genetique. 

[RAPPEL COURS LI S2 SCIENCES DE L'ENVIRONNEMENT] 


Definition de I'ADN, replication de I'ADN, reproduction de la cellule, mutations, expression du 
patrimoine genetique, transcription et traduction de I'information genetique et methylation de 
I'ADN. 

I. ADN, une molecule universelle et variable 

Un chromosome comporte de nombreux genes qui determinent les caracteres phenotypiques d'un 
individu. L'ADN ou acide desoxyribonucleique est le principal constituant des chromosomes et des 
genes. La transgenese est le fait de transferer un gene d'un organisme donneur a un organisme 
receveur. L'information portee par le gene est ecrite dans un langage universel. L'universalite de 
I'ADN est un indice de la parente de tous les etres vivants. 

Structure de I'ADN : deux chames ou brins de nucleotides enroules en une double helice. 

Chaque nucleotide est constitue d'un groupement phosphate, d'un sucre (desoxyribose) et d'une 
base azotee 

Adenine 

Cytosine 

Guanine 

Thymine 

Elies s'associent par des liaisons faibles par le principe de complementarite des bases : A avec T et C 
avec G.Dans un gene c'est la succession ordonnee de nucleotides d'une chame d'ADN, ou sequence, 
qui constitue I'information genetique sous forme codee. Le squelette sucre-phosphate est constant. 
Un meme gene peut exister sous differentes versions : ce sont les alleles. 

La biodiversite est compose de 3 niveaux : ecosysteme (milieu de vie (biotope), especes (biocenose) 
et interactions), especes, caracteres (genetique et allelique) 

La selection naturelle est une variation non aleatoire de la frequence des alleles. 

II. Reproduction conforme de la cellule et replication de I'ADN 
L'interphase : croissance cellulaire et replication de I'ADN 

L'interphase est I'etape du cycle cellulaire precedent la mitose. 

La phase G1 est la phase de croissance cellulaire, les chromosomes a une chromatide sont invisibles. 
La phase de synthese S est le doublement de la quantite d'ADN 

La phase G2 est la preparation de la mitose, les chromosomes invisibles car non condenses, sont a 
deux chromatides 

La phase S est la replication semi-conservative de I'ADN d'une cellule preparant sa mitose. 

1. Separation des deux brins de la molecule d'ADN par une enzyme (ADN polymerase) 

2. Copie de chacun des brins en ajoutant les nucleotides selon les regies de la complementarite AT 
CG : la copie est done conforme. 

3. Chaque molecule d'ADN formee par replication comprend un brin ancien et un brin nouveau qui a 
ete polymerise par I'ADN polymerase. 

4. Les deux molecules d'ADN ainsi obtenues contiennent la meme information genetique, aux erreurs 
de replication pres. 

5. Ces deux molecules forment les deux chromatides identiques d'un chromosome a 2chromatides. 





La replication est I'etape qui permet de conserver la sequence nucleotidique car chaque brin d'ADN 
sert de modele a la synthese d'un nouveau brin. 


La mitose : conservation du caryotype 


La mitose est une des etapes du cyle cellulaire qui se deroule en 4 phases : 



Prophase : condensation de la 
chromatine du noyau, les chromosomes 
a deux chromatides deviennent visibles 
au microscope optique, I'enveloppe 
nucleaire disparait 


Metaphase : Fin de la condensation des chromosomes a deux chromatides qui s'alignent, leurs 
centromeres sont situes au niveau de I'equateur de la cellule, I'ensemble des chromosomes alignes 
forme la plaque equatoriale 

Anaphase : Clivage des centromeres de chaque chromosome et separation des deux chromatides 
soeurs de chaque chromosome, chaque chromatide soeur migre vers un pole de la cellule. 

Telophase : Decondensation des chromosomes a une chromatide, I'enveloppe nucleaire se reforme 
dans chaque nouvelle cellule fille et le cytoplasme se separe ; la cytodierese separe les deux 
nouvelles cellules et marque la fin de la mitose. 

La mitose est la division d'une cellule mere en deux cellules filles. La repartition egale des 
chromatides soeurs dans les 2 cellules filles : conservation des caracteristiques du caryotype= meme 
nombre et meme morphologie des chromosomes. Chaque chromatide soeur etant constitute d'une 
molecule d'ADN quasiment identique, les 2 cellules filles heritent de la meme information genetique 
issue de la cellule mere. Pendant une mitose, la quantite d'ADN d'une cellule est divisee par 2, ce qui 
correspond a la separation des chromatides de chaque chromosome. 


III. Variabilite genetique et mutation de I'ADN 

Les mutations sont des modifications aleatoires de I'ADN 

Les mutations sont des modifications spontanees et au hasard de la sequence d'ADN, elles peuvent 
survenir tout au long du cycle cellulaire. 

II y a trois types de mutations : 

Substitution= changement d'un nucleotide en un autre (AGCT devient ATCT) 
lnsertion= ajout d'un ou plusieurs nucleotides (AGCT devient AGTTTCT) 

Deletion= perte d'un ou plusieurs nucleotides (AGCT devient AT) 

Lorsqu'il y a mutation, une reparation est possible par des enzymes : ces enzymes reperent puis 
corrigent les dommages (nucleotides alteres, mesappariements) et certaines modifications 
echappent au systeme de reparation. 

La mutation peut etre transmise par mitose lorsqu'elle n'est pas lethale pour la cellule mere. 

Les mutations peuvent affecter I'ADN d'une cellule somatique (mutation non hereditaire, non 
transmise a la descendance et qui disparait a la mort de I'individu) ou d'une cellule germinale (qui se 
differencie en gametes, mutation hereditaire qui peut se transmettre a la descendance). 
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Les mutagenes : elements physiques ou chimiques modifiants/alterant I'ADN. Ex : benzene, 
ultraviolet, radioactivite... Les agents mutagenes augmentent la frequence d'apparition des 
mutations et augmente le risque de developper des cancers. Les mutations dans un gene entrainent 
I'apparition de nouveaux alleles. Ms sont sources de biodiversite genetique et sont un des moteurs a 
revolution. 

IV. L'expression du patrimoine genetique 

La transcription, etape precoce de ^expression d'un gene 

La transcription est la premiere etape de la synthese des proteines. Elle se deroule dans le noyau. 
L'ARNpm (ARN pre-messager) est la sequence provenant d'un gene. Contrairement a I'ADN, c'est une 
molecule simple brin. 

4 etapes : 

Ouverture de la molecule d'ADN en separant ses 2 brins au niveau des liaisons hydrogenes 
Formation de la sequence d'ARN= ajout de ribonucleotides 
Si G ADN alors C ARN et inversement 
Si A ADN alors Uracile dans I'ARN et si T ADN alors A ARN 

La polymerisation des ribonucleotides entre eux permet de former la molecule d'ARNpm et de 
completer la fermeture de la molecule d'ADN 

La maturation de I'ARNpm est I'elimination de certains elements (introns) et la conservation d'autres 
(exons). L'epissage se deroule dans le noyau et mene a la formation d'un ARNm. A partir d'un meme 
ARNpm et selon l'epissage, differents ARN messages sont possibles. 


La transcription 
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Exon 1 


Exon 2 


Exon 3 


Exon 4 


Gene 



<= Maturation 


La traduction, seconde etape de I'expression d'un gene 

La traduction est la production d'une proteine a partir d'un ARNm, elle a lieu dans le cytoplasme et 
assure la correspondance entre I'ARNm, la sequence de nucleotides, et la proteine (sequence 
d'acides amines). Le processus est realise par le ribosome selon le code genetique. Un ribosome se 
place le long de I'ARN messager au niveau des codons (triplet de nucleotides) et glisse le long de 
TARN messager et synthetique la proteine, c'est I'elongation. 

Le code genetique associe un codon de trois nucleotides avec un unique acide amine. Le code 
genetique est universel, redondant (plusieurs codons peuvent correspondre au meme acide amine) 
et univoque (un codon correspond a un seui acide amine) 

Deux types de codons non-associes a un acide amine : un codon initiateur (codon AUG par lequel la 
traduction commence toujours) et un codon stop (met fin a I'elongation, done a la traduction). 

La polymerisation est la formation des liaisons peptidiques entre 2 acides amines par le ribosome. Le 
premier acide amine est la methionine correspondent au codon initiateur AUG. Les acides amines 
s'assemblent selon la sequence en acides nucleiques de I'ARN messager et la sequence nucleodique 
(ARN, done ADN et gene) determine la sequence peptidique de la proteine. La polymerisation 
s'arrete au codon stop, la proteine est liberee. 


Le code g^n^tique 

IDeuxieme nuciTOtide 



u 

C 

A 

G 


u 

uuu 

uuc 

phenyl¬ 

alanine 

ucu 

ucc 

UCA 

UCG 

serine 

UAU 

UAC 

tyrosine 

UGU 

UGC 

cysteine 

U 

C 

A 

G 

UUA 

UUG 

leucine 

UAA 

UAG 

STOP 

UGA STOP 

UGG 

tryptophane 

c 

CUU 

cue 

CUA 

CUG 

leucine 

ecu 

CCC 

CCA 

CCG 

proline 

CAU 

CAC 

histidine 

CGU 

CGC 

CGA 

CGG 

arginine 

U 

C 

A 

G 

CAA 

CAG 

glutamine 

A 

AUU 

AUC 

AUA 

isoleucine 

ACU 

ACC 

ACA 

ACG 

threonine 

AAU 

AAC 

AAA 

AAG 

asparagine 

AGU 

AGC 

serine 

U 

C 

lysine 

AGA 

AGG 

arginine 

A 

G 

AUG 

methionine 

G 

GUU 

GUC 

GUA 

GUG 

valine 

GCU 

GCC 

GCA 

GCG 

alanine 

GAU 

GAC 

acide 

aspartique 

GGU 

GGC 

GGA 

GGG 

glycine 

U 

C 

A 

G 

GAA 

GAG 

acide 

glutamique 
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SYNTHESE : Le passage du gene a la proteine se fait en deux etapes. 

D'abord le segment de la molecule d'ADN correspondent au gene est copie sur un brin d'ARN, que 
Ton appelle ARNm, c'est la transcription. 

Puis ce brin d'ARNm est a son tour recopie, mais dans un langage different, celui des acides amines, 
pour donner la sequence correspondent a la proteine synthetisee, c'est la traduction. 

La sequence polypeptidique ainsi constitute prend alors une forme spatiale qui lui est specifique 
pour devenir a proprement parler la proteine. 

L'information genetique definit les fonctions biologiques d'un organisme (reproduction, nutriton, 
excretion, action sur I'environnement, communication) 

Un gene est une sequence d'acide desoxyribonucleique qui specifie la synthese d'une chame de 
polypeptides ou d'un acide ribonucleique fonctionnel. On peut egalement definir un gene comme 
une unite d'information genetique. 

V. Epigenetique et methylation 

L'epigenetique est la discipline de la biologie qui etudie les mecanismes moleculaires qui modulent 
I'expression du patrimoine genetique en function du contexte. 

La methylation est I'ajout ou la substitution d'un groument methyle ( CH3— . (radical alkyle 
hydrophobe).Un radical est une espece chimique possedant un ou plusieurs electrons sur sa couche 
externe non appareilles. Un alkyle derive un alcane par la perte d'un atome d'hydrogene. 
Hydrophobe signifie qui repousse I'eau. Le groupe methyle est derive du methane CH4.) sur un 
substrat. On trouve ce groupe methyle dans des acides amines codes par le code genetique lors de la 
traduction tel que I'alanine, la valine et la leucine. 

La methylation de I'ADN est un processus epigenetique dans lequel certaines bases nucleotidiques 
peuvent etre modifiees par I'addition d'un groupement methyle. Cette modification de I'Adn est 
effectuee par des enzymes particulieres appelees DNMTs pour (DNA methyl-transferase). 

La methylation de I'ADN conditionne I'expression des genes dans chaque cellule. 

Chez les vertebres, plusieurs types de nucleotides methyles peuvent etre rencontres, principalement 
les cytosines et les adenines. 

Prenons I'exemple de la methylation de la cytosine chez les abeilles. 

Une larve d'abeille nourrie 21 jours avec de la gelee royale devient une reine feconde vivant 3 a 5 
ans. Une larve nourrie 3 jours avec de la gelee royale et 18 jours par du miel et du pollen devient un 
ouvriere sterile vivant quelques semaines. La gelee royale inhibe I'enzyme DNMT3 qui methyle la 
cytosine de I'ADN. 

Si il y a deletion du gene DNMT3, la cytosine de I'ADN est methylee et on obtient que des reines. 




Cours 5 : La reinterpretation des donnes et le changement de cadre conceptuel : Les bases de 
I'unite et de la diversite du vivant, concept d'espece et arbres phylogenetiques. 


Sommaire : 

1. Bref aper^u de I'histoire des concepts en evolution. La nomenclature du vivant. Theories 
pour I'origine et devolution des especes. 

2. Notions de phylogenie et arbres phylogenetiques du vivant 

a. Utilisation de criteres morpho-anatomiques 

b. Utilisation de criteres de developpement 

c. Utilisation de criteres moleculaires 

3. Que nous indique un arbre phylogenetique ? 


Bref apergu de I'histoire des concepts en evolution. La nomenclature du vivant. 
Theories pour I'origine et devolution des especes. 



Ilya 4M d'annees, suite a la 
formation de la Terre, une 
evolution chimique se forme et 
une synthese photochimique de 
composes organique s'organise au 
fur et a mesure que I'oxygene 
augmente. Vers 3,7M d'annees, on 
peut dater I'origine de la vie avec 
les bacteries, des lignees 
nucleaires (proto-eucaryotes), 
archees. Les cyanobacteries sont 
des phototrophes oxygeniques et 
apparaissent il y a 2,6M d'annees 
(transformation du CO 2 en O 2 ). 
Entre 2,6 et 1,2M d'annees, la 
couche d'ozone se developpe et 
on passe de 0 , 1 % a 10 % d'oxygene 
atmospherique. Les eucaryotes 
actuels apparaissent il y a 1,2M 
d'annees. Puis viennent ensuite les 
metazoaires (ensemble des 

animaux, etres eucaryotes, pluricellulaires, heterotrophes et generalement mobiles) qui subissent 
des evolutions morphologiques. II y'a 500 millions d'annees, les eucaryotes multicellulaires se 
diversifient en plantes, champignons, animaux...etc. 


Concepts avant le 19 ®"'® siecle pour I'origine des especes 


L'origine et I'histoire des etres vivants sur Terre fait I'objet de nombreuses superstitions, speculations 
philosophiques et visions religieuses (« theologie naturelle » ou « creationnisme » soit le courant 
theologique qui consiste a « connaitre Dieu a partir de I'experience du monde » et Dieu comme 
origine de tout. 







Dans son livre Histoire des animaux, Aristote (384-322 av. J.C.) fait une classification en 3 
categories : Enaima (avec sang) Anaima (sans sang (insectes, mollusques)), Entoma (corps 
divise en segments (generalement 3 parties, abdomen thorax et tete) par incisions 
[entomos). Entoma fut traduit par insecta en latin. II etablit une scala naturae (echelle 
naturelle) avec I'etre humain tout en haut, la matiere animee et la matiere inanimee en bas 
(metaux, sels et roches). 

Pline I'Ancien (23-79) sort les 37 tomes de son Histoire naturelle qui contient de la biologie, 
zoologie, geologie. 

Albert le Grand (1193-1280) et son De animalibus, une etude zoologique en 26 volumes qui 
ajoute une description sur le comportement des animaux, leur mode de reproduction et leur 
anatomie. C'est un commentaire de I'ouvrage d'Aristote. 

Au XVIeme siecle, Conrad Gesner (1516-1565) fait une classification illustree des animaux 
dans Historia animalium. 

Pour I'Archeveque James Ussher (1664) pense que la Terre a ete creee par la Trinite le 26 
octobre 4004 av. J.C. (calcul effectue par I'Ancien Testament). 

Carl Von Linne (1707-1778) : II publie le Systema naturae (systeme morpho anatomique). 
Selon lui, il n'y a pas d'explication aux ressemblances entre especes, c'est I'oeuvre de Dieu. 
Les especes sont des formes similaires mais disjointes les unes des autres. En 1735, il publie 
le premier essai de classification systematique des trois regnes mineral, vegetal et animal. II 
divise les animaux en six groupes (quadrupedes, oiseaux, amphibiens, poissons, insectes et 
vers) en functions d'organes specifiques (dents, bee, nageoires ou ailes). Lors de la dixieme 
edition, en 1758 il generalise le systeme de nomenclature binomial. II veut imposer un 
principe descriptif rationnel et universel. 'kNomenclature de Linne'l^ 
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• Georges-Louis Leclerc de Buffon (1707-1788) est un naturaliste, mathematicien, philosophe, 
ecrivain, biologiste et cosmologiste fran^ais. Dans son Histoire naturelle il etablit un lien 
entre le singe et I'homme, le singe etant un « homme degenere », il fait une classification 
transformiste. II fait aussi des travaux dans la datation de la Terre, I'homme et les animaux : il 
approche la notion d'evolution par celle de « degenerescence ». Les especes peuvent 








changer selon leur environnement. II contribue aussi a des connaissances en geologie en 
introduisant la notion de bio geographie et de chronologie de la Terre. II fait des travaux sur 
la datation de la Terre. 

^Comment definir une espece ? 

C'est une communaute d'etres vivants interfeconds pouvant echanger du materiel genetique et 
produisant des descendants eux-memes feconds (en effet, certains individus du meme genre mais 
appartenant a des especes differentes peuvent se croiser pour donner un individu hybride mais celui- 
ci est le plus souvent sterile) 

Dans le cas de la multiplication strictement asexuee, on parle d'especes a la place de lignee, le 
groupement etant alors purement phylogenetique. 

^Combien d'especes ? 

Le regne animal possederait 7 770 000 especes. Sur Terre, on a 1,244,360 especes cataloguees et on 
predit 8,750 000. Dans les oceans, on aurait 194,409 especes cataloguees pour une prediction de 
2,210 000 especes. 

Les precurseurs des theories evolutionnistes du XlXeme siecle 
o Lamarck et I'heredite des caracteres acquis 

Jean Baptiste de Lamarck (1744-1829) est I'inventeur des termes « biologie, invertebres, vertebres, 
insectes ». C'est un theoricien de devolution. II est partisan de la theorie du transformisme. 
L'environnement agit directement sur les organismes vivants et provoquent leur transformation. 
L'usage (developpement) ou non (atrophie) des organes est le facteur cle expliquant leur 
modification dans le temps. II theorise I'heredite des caractere acquis : Les traits acquis sont 
transmissibles a la generation suivante. De nouvelles especes naissent a partir d'une certaine 
accumulation de modifications. Par exemple la girafe a eu besoin d'avoir un cou plus long pour 
manger les feuilles des arbres et a acquis ce caractere par la suite. La taupe a perdu l'usage des yeux 
par defaut constant d'exercice, puisque la taupe vit sous terre. 
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ANIMAUX APATHIQUES 
M lls ne sentent point et ne se 
meuvent que par leur irritabillU 
excitde. Point de cerveau, ni de 
masse m^duilaire ailong6e». 

ANIMAUX SENSIBLES 

oils sentent, mais n’obtiennent 
de ieurs sensations que des 
perceptions des objets; un cer* 
veau et le plus souvent une 
masse m^dullalre allong^eM. 


ANIMAUX INTELLIGENTS 

«ils sentent; acquierent des 
idees conservables; executent 
des operations entre ces idees, 
qui Ieurs en fournissent 
d'autres; et sont intelllgents 
dans differents degres. Une 
colonne vertebrale; un cerveau 
et une moelle epiniere; des 
sens distincts; les organes du 
mouvement fixes sur les par¬ 
ties d'un squeiette interieur». 



Dans Philosophie Zoologiques 
(1809), Lamarck etablit un 
tableau sous forme d'arbre qui 
schematise I'origine des 
differents animaux. II y aurait 
generation spontanee au 
niveau des vers, qui ensuite se 
complexifient continuellement. 
La matiere inanimee se 
complexifie jusqu'a devenirdes 
etres complexes. 

Un des problemes de la theorie 
de Lamarck est celui de la non 
prise en compte de la 
genetique et du facteur hasard 
que la genetique induit. 
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o Cuvier et le fixisme 


Georges Cuvier (1769-1832) est un anatomiste etudiant les fossiles. II est oppose a I'evolutionnisme 
et a la theorie de Lamarck. Pour lui, les especes vivantes restent immuables, c'est la position du 
fixisme. De nouvelles formes de vie peuvent apparaitre et d'autres disparaitre a I'occasion de 
periodes de destruction, c'est la position du catastrophisme. 

o Darwin et la selection naturelle 

Charles Darwin (1809-1882) est un naturaliste paleontologue britannique du XlXeme siecle. II a 
revolutionne la biologie animale et vegetale par ses nombreux ecrits. II a contribue a de nombreuses 
avances dans tous les domaines des sciences de la vie. II se lance dans I'etude de la geologie et 
persuade son pere pour le laisser partir en tant que volontaire naturaliste sur le Beagle pour aider le 
Capitane Fitzroy dans des travaux de geologie. II fait un compte rendu de ce voyage dans un journal 
de bord, Voyage du Beagle ou il fait des observations naturalistes en Afrique, en Australie et en 
Amerique du Sud (notamment dans les Ties Galapagos). II ajoute que les especes existantes ne sont 
pas fixes et qu'elles se modifient. De retour en Angleterre, il classe, documente et publie ses 
decouvertes et entretient des correspondences avec des savants du monde entier pour plus de 20 
ans de reflexions. II revolt un manuscrit d'Alfred Russel Wallace qui lui donne I'idee de 
transformation des especes par le jeu de la selections naturelle. Son ouvrage L'origine des especes ou 
de son titre original On the origin of species by means of natural selection or the preservation of 
favoured races in the struggle for life sort en Novembre 1859 et c'est un grand succes. II est tres 
critique sur son ouvrage qui pour lui manque de clarte et pense que ses capacites sont moyennes. II 
s'interesse aussi dans ce livre aux plantes et aux emotions chez les hommes et animaux. II est tres 
critique et est sujet de beaucoup de caricatures. 

« Toutes les parties de I'organisation et tous les instincts offrent au moins des differences 
individuelles; la lutte constante pour i'existence determine la conservation des deviations de 
structure ou d'instinct gui peuvent etre avantageuses; et enfin, des gradations dans i'etat de 
perfection de chague organise, toutes bonnes en elles-memes, peuvent avoir existe. Je ne crois pas 
gue I'on puisse contester la verite de ces propositions. » « La nature nefait pas de sauts » 

^Dans ce paragraphe Darwin pose le principe que la selection naturelle favorise dans la 
reproduction, les individus qui possedent des caracteristiques avantageuses dans leur 
environnement. Une espece evolue au cours du temps et avance par strates. Darwin transfere ici a 
la biologie la theorie de I'economiste Malthus avec le « combat pour I'existence » 

« Nous savons aussi gu'un croisement entre des individus distincts de la meme variete, et entre des 
individus appurtenant a des varietes differentes augmente le nombre des descendants, et augmente 
certainement leur taille ainsi gue leur force. Cela resulte principalement dufait gue les formes gue 
I'on croise ont ete exposees a des conditions d'existence guelgue peu differentes. » 

^ Darwin prolonge I'argument de la selection naturelle par le biais de la reproduction : les individus 
les plus avantages sont plus propices a survivre et a etre sujet a reproduction que les autres, la 
descendance heritera de ces caracteristiques avantageuses. Darwin fait evoluer le transformisme de 
Lamarck par le principe de macroevolution (variations entre etres vivants a l'origine des especes). La 
selection naturelle favorise les formes les mieux adaptees. 

« La theorie de la selection naturelle impliguant I'existence anterieure d'unefoule innombrable de 
formes intermediaires reliant, les unes aux autres, par des nuances aussi delicates gue le sont nos 
varietes actuelles, toutes les especes de chague groupe, on peutse demander pourguoi nous ne 
votons pas autour de nous toutes ces formes intermediaires et pourguoi tous les etres organises ne 
sont pas confondus en un inextricable chaos » 
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^Dans ce paragraphe, Darwin etablit que I'ensemble des etres vivants ne forme pas un chaos mais 
des chatnes d'evolutions par strates intermediaires que Ton classer et penser. II pense une 
classification ramifiee. Toutes les especes ont un ancetre commun, et au fil du temps apparaissent 
des variations entre etres vivants a I'origine des especes. C'est la fin du creationnisme. 

« Ce sont les especes dominantes et les plus repandues qui varlent le plus et le plus souvent, et les 
varletes sont souvent locales; or, ce sont la deux circonstances quI rendent fort peu probable la 
decouverte de chainons Intermediaires dans une forme quelconque. Les varletes locales ne se 
disseminent guere dans d'autres regions eloignees avant de s'etre considerablement modifiees et 
perfectionnees; quand elles ont emigre et qu'on les trouve dans une formation geologique, elles 
paraissent y avoir ete subitement creees, et on les considere simplement comme des especes 
nouvelles. » 

^Darwin integre la mobilite des etres vivants dans le critere d'evolution : une fois que les individus 
se sont perfectionnes au maximum ils peuvent migrer ensuite. 


Si Ton fait la synthese des theories de revolution, on peut representer I'evolutionnisme sous forme 
d'arbre (les especes ont une origine commune et se modifient au cours du temps), le transformisme 
comme des diagonales (les especes se transforment a partir d'origine distinctes) et le fixisme comme 
des droites discontinues. 

Evolutionnisme Transformisme Fixisme 


Les principes d'anagenese et de cladogenese 

Bernhard Rensch (1900-1990) est un biologiste allemand ayant fait partie d'un groupe scientifique 
qui a elabore la theorie synthetique de revolution au cours des annees 1930/40. C'est une theorie 
darwinienne de revolution basee sur la selection naturelle et les variations du genome basees sur le 
hasard. C'est une synthese des diverses theories biologiques du XlXeme siecle et du XXeme siecle. 

Rensch popularise le terme d'anagenese (aussi 
appellee evolution phyletique). 

C'est « revolution temporelle et graduelle 
d'une lignee unique qui se transforme 
progressivement pour donner naissance a une 
nouvelle espece, sans ramification. Une 
espece descendante remplace une espece 
ancestrale dans la continuite formant une 
lignee evolutive » 

La cladogenese (terme aussi popularise par 
Rensch) est « le processus evolutif aboutissant a I'apparition de nouvelles especes par la scission de 
nouvelles especes par la scission d'une lignee ancestrale en au moins deux lignees descendante. 
Chacun des deux rameaux evolue alors de maniere isolee et peut donner naissance a une nouvelle 
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espece. La speciation par cladogenese est la consequence de phenomenes de mutations, selections 
et segregations plus ou moins progressifs, sous I'effet d'une cause externe ou interne. 

Deux types de cladogenese : 

Ponctue : une vaste population subit une separation (Amerique du Sud et Afrique il y a 110 millions 
d'annees par exemple) tel qu'une petite population marginale et le reste de la population vont se 
retrouver isoles geographiquement. Du fait du faible effectif, elle evolue rapidement par derive 
genetique sur son territoire. Lorsque I'isolement geographie se termine, les deux populations sont 
suffisamment differentes pour ne plus se croiser. Ilya done un isolement reproducteur qui est 
synonyme de la creation d'une nouvelle espece 

Graduel et phyletique : une vaste population subit une separation en deux populations importantes 
et un isolement geographique vont diverger graduellement car elles sont soumises a des forces 
selectives differentes. Des caracteres nouveaux apparaissent et envahissent chaque ensemble de 
population, tout ceci va produire alors une barriere reproductive pour produire deux nouvelles 
especes. 

L'hypothese de la reine rouge 

Leigh Van Valen propose dans un article de 1973 que la complexification du vivant est une course 
entre les etres vivants ou chaque espece reste en de^a de son optimum adaptatif en raison 
innovations continuelles de ses competiteurs. Chaque espece tends a evoluer par concurrence avec 
les autres especes. Les especes ne sont pas rendues « meilleures ». 

Cette hypothese est nommee Reine Rouge en reference au personnage de la Reine Rouge dans De 
I'autre cote du miroir (Lewis Caroll), personnage qui enframe Alice dans un miroir dans une course 
immobile. Alice s'etonne de la course car elle pense que si I'on court on arrive forcement quelque 
part. La reine repond que le pays d'origine d'Alice est lent. Alice reprend : « Tandis qu'ici il faut courir 
de toute la vitesse de ses jambes pour simplement rester la ou I'on est. Si I'on veut aller quelque 
part, ailleurs [evoluer done], il faut courir au moins deux fois plus vite que 5 a ! ». 
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II. Notions de phylogenie et arbres phylogenetiques du vivant 

a. Utilisation de criteres morpho-anatomiques 

La classification linneenne, inspiree de I'inventaire du vivant propose par Carl von Linne 
(1707-1778) et elaboree dans le cadre du fixisme, precede par coupure, par separation, et non par 
regroupement. 

Dans un traite morpho-anatomique, on classe les especes a partir d'un critere morpho-anatomique 
(par exemple le carene pour les oiseaux) et on fait des classes et des regroupements. 

C'est une cle simplifiee de systematique. On part de criteres generaux (polarite, yeux, bouches, 
corps...) pour aller a du plus specifique. Selon la presence ou non de ces caracteres on range les 
especes. 

On utilise des criteres morphologiques (voire geographiques et ecologiques) pour identifier 
un animal. Les criteres anatomiques, physiologiques, embryologiques, biochimiques et genetiques ne 
sont pas consideres. Lorsqu'un caractere morphologique est pris en compte, soit le specimen a 
identifier presente ce caractere morphologique, soit le specimen a identifier ne presente pas ce 
caractere morphologique. 

On retrouve alors un systeme de repartition normalement dichotomique. 

Les criteres morphologiques utilises au depart doivent permettre de distinguer « facilement » 
les principaux taxons. Ces criteres sont ensuite de plus en plus detailles pour differencier les 
subdivisions jusqu'a correspondre a une et seule espece. 

Cette cle simplifiee ne depasse pas les taxons inferieurs sauf pour les cordes. 

Le systeme n'est pas strictement dichotomique. Par exemple, le niveau 1 (polarite) propose 4 
options (pas de polarite visible, un seui axe, deux axes et trois axes). 

Ce systeme aboutit a une arborisation dont I'agencement des embranchements ne 
correspondra pas a celui presente lors des premieres seances de TD. Les caracteristiques des taxons 
restent cependant identiques. Toute la subtilite reside dans ^appreciation du vocabulaire utilise et la 
connaissance des structures morphologiques evoquees. 

Au contraire, la systematique phylogenetique, aussi nommee cladistique, a rompu avec les 
procedures de separation, pour se concentrer sur des regroupements justifies par ce que les 
membres d'un ensemble partagent vraiment. Consequences : abandon des invertebres, prosimiens, 
reptiles, poissons et nombre des groupes linneens, pour d'autres dont I'agencement dans I'arbres 
respecte I'apparentement. 

Darwin a fait un arbre theorique ou il classe les especes en vertu de souches communes. 
Hennig expose lui une methode empirique qui permet de faire le classement de Darwin. Tandis que 
Darwin expose une genealogie theorique, Hennig expose la phylogenie. Dans le cadre empirique, 
I'arbre classe selon « qui est apparente a qui ». 

Dans un systeme cladistique, on etablit des correspondences selon les formes d'organismes, les 
squelettes, les plans d'organisations des etres vivants. 

La parcimonie est le principe de simplicite ou principe d'economie ou le principe selon lequel « les 
hypotheses suffisantes les plus simples sont les plus vraisemblables ». En science et en philosophie, 
la parcimonie est un principe consistent a n'utiliser que le minimum de causes elementaires pour 
expliquer un phenomena. Par exemple en genetique, ce principe privilegie la sequence avec le 
minimum de changements evolutifs pour expliquer des relations phylogenetiques. 
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Ainsi, lors de la classification evolutive de plusieurs taxons selon plusieurs caracteres (par exemple 
avec un arbre phylogenetique), on applique le principe de parcimonie en cas de difficulte a 
determiner quelles especes sont les plus proches : I'hypothese de phylogenie retenue est celle qui 
maximise le nombre d'hypotheses d'homologie (similitude due a une ascendance commune) tout 
en minimisant le nombre d'hypotheses d'homoplasie (similitude due a une adaptation 
convergente). 


La monophylie est la caracteristique d'un groupe qui contient I'espece souche dont descendent tous 
ses membres. >1^ 


/ / / / / 


/ 

/ 4ii> I 

Ar^rkito 

lofapodo 


La polyphylie est le fait de mettre dans un 
meme groupe des taxons en excluant leur 
ancetre common.'k 


La paraphylie est le fait de mettre dans un meme 
groupe taxinomique une espece ancestrale et une 
partie seulement de ses descendants.'k 




b. Utilisation de criteres de developpement 


On peut utiliser la notion d'homologie entre les etres vivants pour voir comment certains criteres se 
sont developpes avec le temps. 


L'embryologie comparative permet de comparer les embryons de plusieurs especes. Elle donne en 
faveur de devolution car il y a des similitudes developpementales entre differentes especes. 


L'embryon entre I'homme le poulet, le serpent, la salamandre, le poisson est a peu pres le meme 
avec la presence d'une queue. Deux structures sont homologues si elles sont une meme origine 
embryonnaire. 


c. Utilisation de criteres moleculaires 


Evolution des molecules, evolution des genes, evolution des genomes^ evolution des especes. On 
peut etablir des parentes graces aux acides amines et aux codons pour voir les ressemblances 
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L'ARN ribosomique est une bonne molecule pour faire I'arbre phylogenetique de I'ensemble des 
etres vivants car elle est aussi presente chez les bacteries. 

III. Que nous indique un arbre phylogenetique ? 

Un arbre phylogenetique est litteralement I'arbre qui raconte la genese des lignees. « Phylogenie » 
vient du grec phulon (lignee) et genesis (genese). Historiquement ce terme n'a pas ete defini par 
rapport aux genes. 

La phylogenie (phylogenese) est une reconstruction de I'histoire evolutive des etres vivants. Le 
terme phylogenese a ete introduit par Haeckel en 1866. Les fondements de la systematique 
phylogenetique ou cladistique ont ete formules par Willi Hennig en 1950. 

L'analyse phylogenetique a pour objectif de reconstruire des liens de parente entre les organismes 
et d'estimer leurs temps de divergence. 

Un arbre phylogenetique est une representation graphique de la phylogenese d'un groupe de 
taxons. Les sommets representent les taxon ou les unites evolutives (OUTs-operational taxonomix 
units). Les noeuds internes representent des ancetres hypothetiques. Les branches definissent les 
relations entre les taxons en terme de descendance. 

II existe plusieurs types d'arbres (dendrogrammes) selon les methodes avec lesquelles ils ont ete 
construits : 

Phenogramme : un dendrogramme obtenu par methodes de distance ou les relations entre 
taxa expriment les degres de similitude globale. 

Cladogramme : un dendrogramme exprimant les relations phylogenetiques entre taxa et 
construit a partir de l'analyse cladistiques. 

Phylogramme : un cladogramme dont la longueur des branches est proportionnelle au 
nombre de changements evolutifs. 

La longueur d'une branche est proportionnelle a la distance evolutive entre les sequences et leurs 
ancetres (unite= substitution/site). Une branche est un trait et une feuille est le nom des especes. 

La plupart des methodes de phylogenie produisent des arbres sans racine (unrooted tree versus 
rooted tree). Ceci est du au fait que ces methodes detectent les differences entre les sequences, 
mais n'ont pas les moyens d'orienter ces changements par rapport au temps. 

II existe deux moyens pour enraciner un arbre sans racine : 

La methode du groupe exterieur : il faut inclure dans l'analyse une sequence ou un groupe 
de sequence dont on postule a priori qu'ils sont externes au groupe etudie ; la racine est par 
necessite sur la branche qui rejoint le groupe exterieur avec les autres sequences. 

Faire I'hypothese de I'horloge moleculaire : toutes les lignees sont supposees avec evoluees 
avec la meme vitesse depuis leur divergence avec leur ancetre common. La racine est situee 
au point equidistant de toutes les feuilles de I'arbre. 

Un arbre non enracine est une representation intemporelle des 
relations phylogenetiques. 

Un arbre enracine specifie ou se situe I'ancetre common de tous les 
taxons presents dans I'arbre, considere comme la racine de I'arbre. 
L'arbre enracine est oriente dans le temps. 
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L'histoire evolutive des genes revele celle des 
especes qui portent ces genes, a I'exception de la 
presence de transfert horizontal (transfert de 
gene entre espece) et de duplication genique 
(orthologue/paralogue) 

Remarques sur la representation genetique : 

II n'y a pas de hierarchie objective dans les taxons 
existant actuellement. Toutes les especes sont evoluees, et presentent chacune une mosaique 
d'etats derives et d'etats ancestraux de caracteres, mosaique variable d'un taxon a I'autre. 
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Cours 6 : Diversite genetique et code barre moleculaire. 


I. Diversite genetique, selection et reproduction 

a. Cycle chromosomique, cycle de vie, reproduction sexuee et meiose 

La reproduction sexuee implique un echange de patrimoine genetique entre les individus d'une 

meme espece. 

^ Qu'est-ce que le sexe ? 

Ce sont les echanges (ou recombinaison genetiques), la production d'une nouvelle information 
composite a partir de deux ou plusieurs autres. 

C'est la notion de parasexualite, les echanges genetiques sans reproduction d'individus. 

La reproduction sexuee constitue les echanges genetiques associes a la reproduction des individus. 

La parthenogenese est la division a partir d'un gamMe femelle non feconde. C'est un mode de 
reproduction monoparental comme I'auto-fecondation qui necessite quant a elle I'intervention des 
deux gamMes, males et femelles, apportes par le meme individu hermaphrodite. On parle de 
parthenogenese thelytoque lorsque les males sont absents, la descendance est uniquement 
composee de femelles. On parle de parthenogenese arrhenotoque quand les femelles sont absentes, 
la descendance est uniquement composee de femelles. On parle de parthenogenese deuterotoque 
quand il y a parfois apparition de males de maniere cyclique a une periode de I'annee. Ilya 
production de males et de femelles. 

La meiose est le processus de double division cellulaire permettant la formation de gamMes, ou 
cellules sexuelles chez les organismes eucaryotes. Elle se distingue de la mitose, division cellulaire 
somatique qui ne se deroule qu'en un temps. A partir d'une cellule mere diplo'ide on obtient quatre 
cellules filles haplo'ides au materiel genetique different. II n'y a pas de duplication de I'ADN lors de la 
meiose. 

Une premiere phase appelee « interphase » avant la meiose va permettre la duplication de I'ADN et 
la condensation en chromatides. Les chromosomes homologues vont s'enjamber en certains points 
et echanger du materiel genetique. La cellule est dite « diplo'ide », elle presente deux exemplaires de 
chaque chromosome. Les chromosomes homologues vont se retrouver sequestres sur un plan 
equatorial puis separes. Chacun va migrer vers un des deux poles de la cellule. Ilya alors un premier 
brassage genetique (ensemble des recombinaisons genetiques dans une population), le brassage 
interchromosomique. On va avoir alors deux premieres cellules filles dites « haplo'ides »(elles ne 
contiennent qu'un exemplaire de chaque chromosome) lors de la premiere meiose. 

La deuxieme meiose va donner a partir des deux premieres cellules filles, quatre cellules filles. On va 
avoir une autre division et les chromatides vont etre separees pour se retrouver dans une nouvelle 
cellule appelee gamete. Ce processus genere de la diversite genetique car cela permet d'aboutir a la 
formation de cellules haplo'ides con^ues pour fusionner avec d'autres pour obtenir des cellules 
diploi'des apres fecundation. 

En effet, un ovocyte haplo'ide et un spermatozo'ide haplo'ide va former apres fecundation un zygote 
diplo'ide. 

II y a differents types de cycle chromosomiques chez les etres vivants : 
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Les cycles haplodiplophasiques sent des cycles que Ton retrouve chez de nombreux vegetaux avec 
une equilibre des deux phases haploide et diploide. 

Les cycles diplophasiques avec predominance de la phase diploide que I'on retrouve chez de 
nombreux animaux et fucus. 

Les cycles haplophasiques avec predominance de la phase haploide que I'on retrouve chez les 
spirogyre. 

Lors des mitoses successives suite au zygote, le zygote va donner naissance a des cellules immortelles 
qui vont-elles memes donner des cellules immortelles dans le cadre d'une lignee germinate 
(hereditaire) et des cellules mortelles dans la cadre d'une lignee somatique (non hereditaire). La 
cellule va done exprimer des fonctions conferant le caractere mortel de la cellule. 

Les cellules germinales se trouvent dans les ovaires et testicules, les cellules somatiques 
constituent le reste des cellules du corps. 

La meoise permet done de former des gamMes haploides. La fecondation reunit deux gamMes 
haploides pour former une cellule-oeuf diploide. L'alternance meoise/fecondation permet done de 
maintenir la stabilite du caryotype dans I'espece humaine. Le principe est le meme chez les autres 
especes animales. 




OiROMOSOMC S 
mRANSNlS (\yjx. 

CfLc-uLfs sexueLurs 


Lors de la meiose, le brassage 
genetique 

interchromosomique 
s'effectue par un precede de 
crossover ou de chiasme tel 
que I'on va effectuer une 
recombinaison des 
chromatides. 

Cette recombinaison se 
produit avec des proteines 
d'assemblage et un systeme 
de synapse et se termine avec 
des proteines de 
desassemblage 
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(b)Recombinaison au niveau des genes 
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(C) Recombinaison au niveau des nucleotides 
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Une seule chaine 
de I'ADN est 
representee 


Les recombinaisons se font au 
niveau des genes et des 
nucleotides tel que 

<■ 


Au niveau de la fecundation, 
I'ovule est constitue d'une 
zone pellucide, d'une 
membrane plasmique, de 
granules cortical, d'un noyau 
avec un nucleole a I'interieur, 
d'un cytoplasme et d'un 
globule polaire. 

Le spermatozoide va utilise 
une proteine, le 
galactosyltransferase 
membranaire pour se fixer 
sur la zone pellucide de 


I'ovule qui contient des residus N-acetylglucosamine de la macromolecule ZP 3 . 

Fixation primaire du spermatozoide a la zone pellucide 



Zone pellucide 


Corona radiata 


Membrane plasmique 


K Cytoplasme V 

1, Noyau 




Globule polaire 

Nucleole 

Granule cortical 



La diversite genetique entre individus d'une meme espece se fait par des differences genetiques 
entre individus d'une meme espece qui apparaissent au fil du temps du fait des mutations 
(modifications de sequences transmises aux descendants (microevolution). Le genome est a 99,9% 
identique entre les diverses populations du globe. On definit une population comme un groupe a 
base geographique, culturelle...au sein duquel se fait la reproduction (pool genetique). On parle 
d'endogamie quand les membres d'un groupe social choisissent leur conjoint a I'interieur de ce 
groupe. On parle d'exogamie quand les membres d'un groupe social choisissent leur conjoint a 
I'exterieur de ce groupe. 

Une race (definition du Larousse) est une population animale resultant, par selection, de la 
subdivision d'une meme espece et possedant un certain nombre de caracteres communs 
transmissibles d'une generation a la suivante. 
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C'est la categorie de classement de I'espece humaine selon des criteres morphologiques ou culturels, 
sans aucune base scientifique et dont I'emploi est au fondement des divers racismes et de leur 
pratiques. (Face a la diversite humaine, une classification sur les criteres les plus immediatement 
apparents [couleur de la peau surtout] a ete mise en place et a prevalu tout au long du XlXeme 
siecle. Les progres de la genetique conduisent aujourd'hui a rejeter toute tentative de classification 
raciale chez les etres humains. 

Litteraire : Lignee familiale consideree dans sa continuite ; ensemble des ascendants ou des 
descendants d'un personnage ou d'un groupe humain. 

Ensemble de personnes presentant des caracteres communs (profession, comportement, etc.), et 
que I'on reunit dans une meme categorie. 

b. Selection naturelle et reproduction sexuee 

i. La selection porte sur les genes 

La selection naturelle porte sur I'information, les genes. Les genes que I'on observe aujourd'hui sont 
ceux qui se sont le mieux repliques lors des generations precedentes. Ce qui est transmis d'une 
generation ce sont les informations codant le developpement des organismes : la selection opere un 
tri parmi ces informations, ne conservant que celles qui ont les meilleures proprietes de replication. 
Les individus sont des entites transitoires, ce qui persiste de generation en generation, ce sont les 
genes et non pas I'espece. 

« Les organismes sont des artifices inventes par les genes pour les reproduire », Richard Dawkins, Le 
gene egoiste 


ii. Selection et competition 

La selection naturelle ne favorise pas la « survie de I'individu » ou « la survie de I'espece » : la 
selection naturelle favorise les genes qui permettent une meilleure appropriation des ressources 
que les autres. 

La premiere idee intuitive est que la selection naturelle favoriserait la survie de I'espece. Tel que la 
selection naturelle garde seulement les genes qui maximisent la reproduction des individus (en 
negligeant tous les systemes « parasites ». Done grace a la selection naturelle, les individus se 
reproduisent de mieux en mieux et exploitent de mieux en mieux les ressources du milieu. Done si la 
reproduction est meilleure, I'espece (ensemble des individus) a moins de chances de s'eteindre. 

La competition est partout: competition pour I'acces aux ressources (croissance orientee des racines 
pour acceder aux nutriments), competition pour la reproduction...C'est I'hypothese de la Reine 
Rouge. La dispersion permet I'evitement de la competition entre apparentes : en cause des 
emigrations depuis des sites a duree limitee de vie ou la fondation de nouvelles populations. 

Par exemple pour les plantes, la dispersion permet de disperser le genotype et d'entrer en 
competition avec les autres plantes pour remplacer leur genotype. En effet, il est inutile d'etre en 
competition avec soi meme, d'ou la dispersion. 

iii. Hasard, usure et contingence 

La selection naturelle n'est pas I'unique processus evolutif. Tout en biologie ne comprend pas a la 
lumiere de la selection naturelle, il faut tenir compte du hasard. 

Les processus d'echantillonnage des genes (derive genetique) amenent a perdre la diversite. Les 
mutation deleteres abiment continuellement le pool genetique des populations. Les populations 
incapables de purger leurs mutations deleteres risquent de les exprimer trop fortement voire meme 
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de les fixer (depression de consanguinite (reduction des criteres de selectivite suite a la reproduction 
entre individus apparentes) ou fonte mutationnelle (dans les grandes populations, les mutations 
desavantageuses qui se produisent en permanence et se transmettent sont eliminees par le 
processus de selection naturelle. Dans les petites populations, ce processus de selection n'est plus 
aussi efficace et aboutit a I'accumulation de mutations deleteres, qui peu a peu, vont reduire la 
capacite de la population a croitre). 

Le taux de substitution est le taux de mutations qui restent apres selection. La tres grande majorite 
des mutations sont soit neutres ou deleteres. Les mutations avantageuses sont tres rares. 

En 1979, les biologistes evolutionnistes Richard Lewontin et 
Stephen J. Gould ont utilise le terme d'architecture « spandrel » 
pour illustrer la distinction entre devolution d'une caracteristique 
phenotypique qui a confere un avantage selectif par son utilite 
directe, et celui qui provient simplement comme un produit 
derive de ce processus. Par consequent I'expression « spandrel » 
se refere a I'utilisation adapatee d'une function selectionnee dans 
un autre but. Une « spandrel » peut ensuite etre cooptes pour un 
autre usage tres fructueux selon un processus connu sous le nom 
« d'exaptation ».. Un pendentif (ou spandrel tridimensionnel) est 
forme comme un espace forcement triangulaire ou un dome rond 
reunit deux arcs en plein cintre a angle droit. 



II. Code barre moleculaire du vivant 

Plusieurs expressions : code barre moleculaire, barcode moleculaire, barcoding moleculaire, DNA 
barcoding, code-barre genetique. 

C'est une methode d'identification moleculaire fondee sur la comparaison de sequences precises 
d'ADN presentes dans un echantillon ou un specimen, vivant ou mort. 

Le barcode sert a aider la taxonomie lorsque les criteres anatomo-morphologiques sont peu 
distinctifs des especes. De plus il existe une « crise » de la taxonomie, car peu il y a peu de 
taxonomistes et cette methode est egalement utile pour la « taxonomie traditionnelle ». Le barcode 
sert a mettre en evidence de nouvelles especes dans un souci de meilleure connaissance de la 
biodiversite et de sa conservation. Au taux actuel d'especes decrite par an et en function du nombre 
d'especes supposees, il y faudrait entre 1500 et 15 000 ans pour inventorier cette biodiversite. 

C'est une methode standardisee pour fournir un outil supplementaire pour les taxonomistes. II ne 
necessite pas de connaissances approfondies du taxon (information independante du taxonomiste). 
C'est une methode relativement rapide pour repondre a la demande d'expertise en biologie de la 
conservation, agriculture, sante publique, environnement, agronomie. On assigne un individu 
quelque soit son stade de developpement, son etat de conservation et le materiel disponible. 

Cependant les taxonomistes sont aussi necessaires dans les differents milieux : dans la biologie de la 
conservation, on a besoin d'eux pour reconnoitre les especes en danger et lutter centre les especes 
invasives. Dans I'agriculture on a besoin d'identifier les especes nuisibles. Dans la sante publique on a 
besoin de lutter centre les vecteurs des especes pathogenes et les pathogenes eux-memes. En 
environnement on a besoin de suivre des especes indicatrices de la qualite de I'environnement et en 
agronomie on a besoin de verifier I'identite des especes exploitees. 
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Certains echantillons (larves, oeufs, fragments) ne sent pas reconnaissables via des caracteristiques 
morphologiques. Tres souvent, les echantillons qui sont les pus interessants a identifier d'un point de 
vue applique sont justement dans ce cas la (saisies en douanes, repression des fraudes). 
L'identification moleculaire est dans ces cas la seule alternative. 

^Quels outils pour le barcoding moleculaire ? 

Un marqueur genetique approprie pour le barcoding moleculaire doit repondre a un certain nombre 
de criteres : 

Dans le groupe d'etude, le marqueur doit etre suffisamment variable pour discriminer entre 
la plupart des especes, mais suffisamment conservee pour etre moins variable au sein d'une 
espece. 

Les sites d'amor^age doivent etre suffisamment conserves pour permettre une amplification 
fiable sans risque de faux negatifs lorsque I'objectif est I'analyse des echantillons groupes, 
par exemple, lorsque I'on veut analyser I'ensemble des animaux present dans un echantillon 
de sol sans separer les individus ou analyser de I'ADN de I'environnement telles que I'ADN 
subfossile residuel du sol. 

Le gene doit apporter une information phylogenetique suffisante pour affecter les especes 
de grands taxons utilisant des approches phenetiques simples. 

L'amplification et le sequen^age doivent etre aussi robuste que possible, meme dans des 
conditions et des protocoles de laboratoire variables. 

L'alignement des sequences doit etre possible egalement parmi les taxons lointainement 
apparentes. 

Pour les animaux, le choix s'est porte sur une sequence d'environ 650 paires de bases du gene 
codant la sous unite 1 de la cytochrome c oxydase mitochondriale (COI). C'est une enzyme situee 
dans la membrane mitochondriale interne chea les eucaryotes aerobies (contenant du dioxygene). 
Avec un taux de 2% par million d'annees, deux sequences de 600 paires de bases qui ont evoluees 
independamment depuis un million d'annees auront done en moyenne 12 nucleotides de difference. 
II y a done de grands interets techniques : amorces universelles, beaucoup de copies par cellule, gene 
haploide (non-recombinant). 

La sequence du genome mitochondrial permet I'obtention de nombreuses copies dans une meme 
cellule (100 a 10 000 copies) et une variabilite intra specifique faible (perte du polymorphisme en 
relation avec I'heredite maternelle du genome mitochondrial) ce qui rend le genome mitochondrial 5 
a 10 fois plus « specifique » que le genome nucleaire. 

Les deux proprietes du genome mitochondrial (faible variabilite intra specifique et forte variabilite 
inter specifique) sont a I'origine d'une veritable frontiere genetique bien caracterisee entre la plupart 
des especes. C'est cette propriete qui donne au genome mitochondrial la capacite d'identifier les 
especes. 

Enfin, il n'y a pas d'introns dans le genome mitochondrial, ce qui rend plus facile l'amplification des 
sequences. 

Le genome mitochondrial humain est compose de 13 genes codant des proteines, 2 genes codant des 
ARN ribosomaux et 22 genes codant des ARN de transfert. 

^ Quelles sont les limites du barcoding moleculaire ? 

Dans les groupes ou la taxonomie est bien connue (les oiseaux par exemple), on peut identifier un 
specimen a partir d'une sequence d'ADN (expertise taxonomique). Dans les autres groupes, il reste a 
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consolider la taxonomie avec tous les outils dont disposent les scientifiques (anatomies, 
morphologies, molecules...) avant de pouvoir se contenter de n'utiliser qu'un seui gene pour attacher 
un specimen a un nom d'espece. 

Le precede de barcoding se revele egalement inefficace dans le cas d'especes recemment separees 
mais aussi dans le cas d'insertion ponctuelle d'un fragment d'ADN dans le genome d'une autre 
espece (phenomene d'introgression qui se realise a I'occasion d'hybridations entre des individus de 
deux especes differentes). Les pseudogenes nucleaires (copies de genes non exprimees) peuvent 
egalement entramer des complications dans I'identification des especes. 

Enfin, cette technique s'applique a tout specimen ou echantillon tant que de I'ADN en relativement 
bon etat est present, meme en faibles quantites, y compris des echantillons seches, cults, broyes et 
melanges...Cependant, meme si elle peut s'appliquer egalement a des specimens anciens, il est 
impossible de tirer des resultats d'echantillons a ADN trop denature. 

^ Comment mettre en oeuvre le barcoding moleculaire ? 

II faut d'abord une librairie de sequences suffisamment importante pour pouvoir mettre en evidence 
la frontiere genetique entre les variations intra et interspecifiques. 

On sequence d'abord un grand nombre d'individus. On calcule ensuite les distances entre chaque 
sequences a I'aide d'une matrice de distance comme MEGA (Molecular Evolutionary Genetics 
Analysis). On compare ensuite les variabilites intra et interspecifique. L'utilisation d'une base de 
donnee de sequences biologiques et I'alignement multiple des sequences permet de determner un 
positionnement phylogenetique. 


Determination de la frontidre genetique 

L’exemple des Mammiferes 


Base de donn6es ; 719 specimens 

L'analyse de la matrice de distance fait apparaftre une frontiere genetique nette 
entre les variations inter et intra spedfiques. Ce qui permet d’envisager d’utiliser la 
sequence COI dans le groupe des Mammiferes pour realiser des caracterisations 
d’especes. 
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L'histogramme ci-dessus presente deux groupes d'individus : Un premier groupe qui presentent 
entre leurs sequences COI des distances elevees comprises entre 0,15 et 0,36 qui correspondent a 
des distances entre des individus d'especes differentes. Un deuxieme groupe d'individus qui 
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presentent entre leurs sequences COI des distances faibles comprises entre 0 et 0,01 qui 
correspondent a des distances entre des individus de meme especes. 

Entre ces deux « populations », il existe des distances intermediaires mais representant moins de 1% 
du total des distances mesurees. 

Ces valeurs intermediaires peuvent provenir de : 

2 especes taxonomiquement differentes qui n'en sont en realite qu'une seule ce qui se 
traduit par des distances associees a des variations interspecifiques mais qui en fait 
correspondent a des variations intraspecifiques. 

1 espece qui en contient en realite 2 ce qui se traduit par des distances associees a des 
variations intraspecifiques mais qui correspondent a des variations interspecifiques. 

Des problemes d'echantillonnage. 

Des problemes lies a la qualite de la sequence COI utilisee. 

La realisation de phytogenies avec des sequences de specimens varies permet de valider 
■'utilisation d'une sequence de reference pour un taxon donne. 

http://www.boldsvstemps.org/ est le site qui permet d'explorer les donnees barcode et d'identifier 
les sequences (BOLD : Barcode of Life Data Systems). En 2018, on compte plus de 6M de sequences 
soit 2 fois plus qu'il y a 4 ans. 
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Cours 7 : Genetique et ethique 


I. Les maladies genetiques 

Parmi les maladies genetiques on trouve des maladies : 

Monogenique : hemophilies, myopathie de Duchenne, mucoviscidose, maladie de 
Huntington, certains cancers, immunodeficiences, maladies metaboliques, syndrome de I'X 
fragile, hemochromatose...Elies sont rares et proviennent de mutations causales. 
Multifactorielles : diabMe, infarctus du myocarde, hypertension, asthme, polyarthrite 
rhumatoide, obesite, cancers, psychiatrie. Maladies communes avec des facteurs genetiques 
de predisposition ou de vulnerabilite ainsi que des facteurs environnementaux. 

Dans la genetique on peut parler de traits quantitatifs comme la taille le poids et I'hypertension 
arterielle. CE sont des traits avec une distribution normale dans la population. On parle d'anormalite 
pour 2 d.s. au-dessous ou au-dessus de la moyenne. La taille est un trait quantitatif a variability 
continue : 80% de la taille est determinee par I'heredite et des variations entre populations et dans le 
temps font evoluer la taille. 

Les traits qualitatifs sont des traits comme I'infarctus du myocarde, la polyarthrite rhumatoide, la 
maladie de Crohn, I'asthme, I'obesite, la maladie d'Alzheimer, le diabete, la schizophrenie. Les 
caracteristiques de traits qualitatifs sont un effet de seuil (seuil dans la population en fonction de la 
predisposition. Une fois ce seuil atteint, le trait qualitatif se manifeste. On distingue aussi nettement 
un phenotype normal et anormal. Ilya une variation continue sous-jacente predisposant a la 
malformation avec un seuil conduisant a un phenotype anormal. 

A) Les maladies monogeniques 

Les maladies monogeniques sont liees a la mutation d'un gene et on parle d'heredite mendelienne 
(transmission des maladies dues a une mutation dans un seui gene.). 

Les lois de Mendel : 

Premiere loi: Loi de I'uniformite des hybrides de premiere generation. Lorsque I'on croise 
deux espece, la premiere generation d'hybride est toujours uniforme alors que le genotype 
et le phenotype des descendants sont heterozygotes (AA+aa=Aa) 

Deuxieme loi: Loi de disjonction des alleles (ou de segregation des caracteres dans la 
generation F2): Le croisement d'un hybride par lui-meme donne 3 descendants 
genotypiquement differentes mais phenotypiquement egaux, et 1 genotypiquement et 
phenotypiquement different. 

Troisieme loi : Loi d'independance de la transmission des caracteres : On croise la premiere 
generation hybride avec un parent recessif (dont les caracteres ne peuvent etre observes 
que si ses deux genes sont egaux) 

Les maladies monogeniques representent environ 5000 maladies. On parle de transmission 
autosomique lorsque les caracteres transmis sont portes sur les chromosomes sexuels appeles 

autosomes. 

Un parent est dit sain s'il ne possede pas le gene et ne risque pas de le transmettre a sa 
descendance. Un parent est dit porteur sain s'il n'est pas atteint par la maladie, mais s'il possede le 
gene que lui a transmis I'un de ses propres parents. Un parent est dit atteint lorsque la maladie 
s'exprime chez lui. 
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Chaque gene est normalement present deux fois. Si les deux versions sont identiques, on est 
homozygote. Si les deux versions sont differentes, on est heterozygote. Un gene est dominant s'il 
s'exprime (il permet a lui seui d'avoir une incidence sur le corps.). Ce sont des genes heterozygotes 
avec une copie du gene altere qui sont alteres. II est recessif s'il ne s'exprime pas tout seul. Ce sont 
des homozygotes avec deux copies du gene altere qui sont affectes. Un gene recessif lie a X est un 
male avec une copie du gene altere sur le chromosome X qui sont affectes. 

La transmission autosomique dominante est lorsque I'un ou deux parents possedent le gene 
dominant et est done atteint. 

Un des parents est atteint et homozygote= 100% des enfants seront atteints. 

Un parent est atteint et heterozygote, I'autre est sain= 50% des enfants risquent d'etre 
atteints. 

Les deux parents sont atteints et heterozygotes= 75% des enfants seront atteints. 
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La transmission autosomique recessive est lorsque soit I'un des parents presente la maladie, il est 
atteint et done porteur de deux genes deficients ou que I'un des parents possede le gene mais il n'est 
pas par la maladie. 

Dans le premier cas, si I'autre parent est lui aussi atteint, 100% des enfants seront atteint. Si I'autre 
parent n'est pas atteint mais porteur du gene deficient, 50% des enfants seront atteints et tous 
seront porteur du gene deficient. Si I'autre parent n'est pas porteur du gene deficient, aucun des 
enfants ne sera atteint mais tous seront porteurs du gene qu'ils risquent de transmettre a leurs 
enfants. 

Dans le deuxieme cas, si I'autre parent est lui aussi porteur sain de la maladie, 25% des enfants 
risquent de presenter la maladie, 50% seront porteurs sans etre atteints et 25% seront sains. Si 
I'autre parent ne porte pas le gene deficient, aucun des enfants ne presentera la maladie mais 50% 
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d'entre eux risquent de transmettre la maladie a leur propre descendance. Ce cas fait qu'une 
maladie hereditaire qui ne s'est pas manifestee depuis des generations peut se manifester 
brusquement. Ce probleme intervient surtout dans des mariages consanguins, intra-ethniques ou 
intra-regional. 
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Les maladies monogeniques sont liees au chromosome X. 

Certaines maladies d'apparence multifactorielle peuvent etre en realite monogeniques comme 
I'obesite par mutation du gene LEP. Cette obesite se manifeste de maniere severe, precoce avec 
hyperphagie mais une croissance staturale normale. 

B) Le cas du cancer du sein 

Le gene BRCAl est un grand gene situe sur le chromosome 17q contenant 22 exons codant 1 683 
acides amines. Plus de 500 mutations ou variations de sequence ont deja ete decrites, et le plus 
souvent une mutation semble unique pour chaque famille. 

Pres de 90% des families atteintes d'un cancer du sein ou de I'ovaire de transmission dominante 
autosomale presentent une anomalie chromosomique de cette region. Pour les families n'ayant que 
des cancers du sein, on retrouve I'anomalie dans environ 45% des cas. Certaines families, n'ayant que 
des cancers de I'ovaire, ont aussi une anomalie de BRCAl. Les hommes porteurs d'une anomalie 
BRCAl ne semble pas avoir un risque accru de cancer. 

L'anomalie genetique de BRCAl est transmise de fagon dominante, autosomale mais avec une 
penetrance incomplete. Environ 50% des enfants portent ce trait. Les femmes porteuses du trait ont 
un risque de developper un cancer du sein pendant leur vie dans 55% a 85% des cas et un cancer de 
I'ovaire dans 15 a 45% des cas. 


39 










































II. Notions de genetique moleculaire des cancers 

A) Bases moleculaires de I'oncogenese. 

^Quelles sont les causes genetiques des cancers ? 

Elies sont dues a des alterations genetiques propres au clone tumoral. 

- Alterations des oncogenes : genes dont I'activation (alteration monoallelique, mutation gain de 
fonction) va accelerer la proliferation cellulaire. 

- Alteration des genes suppresseurs de tumeur: genes done I'inactivation (alteration biallelique, 
mutation perte de fonction) va alterer les mecanismes de controle du cycle cellulaire, de I'apoptose ( 
mort cellulaire programmee) ou de la differenciation cellulaire. Ou encore des genes codant des 
proteines impliquee dans la detection et la reparation des dommages de I'ADN. 

Les proteines codees par les oncogenes : proteines impliquees dans la transduction du signal 
mitogene, proteines controlant le cycle cellulaire, proteines impliquees dans I'apoptose, proteine 
regulatrice de I'immortalite cellulaire, proteines impliquees dans les processus de metastase (une 
metastase designe un foyer de cellules cancereuses se developpant sur un organe mais provenant du 
cancer affectant un autre organe), proteines pro-angiogeniques (croissance de nouveaux vaisseaux 
sanguins a partir de vaisseaux preexistants). 

Les genes suppresseurs de tumeurs sont alteres tel qu'au niveau du gene, I'inactivation du gene est 
une condition essentielle au developpement tumoral. Elle se fait soit par des mutations perte de 
fonction qui sont associees a une perte d'heterozygotie (ou inactivation due a un mecanisme 
epigenetique comme la methylation du promoteur), soit a un syndrome de predisposition hereditaire 
aux tumeurs (un patient atteint de mutation constitutionnelle est predispose a developper une 
tumeur, a contrario, mutations somatiques dans les tumeurs sporadiques). Ces genes produisent une 
proteine capaple d'inhiber la croissance de cellules tumorales in vitro par reversion du phenotype 
tumoral. 

Les genes codant des proteines impliquees dans la detection et la reparation des dommages de 
I'ADN sont le BRCAl BRCA2, MLHl, MSH2, PMSl, PMS2. 

B) Agregation familiales de tumeurs frequentes 

a. Cancer du sein 

Le cancer du sein dans la population resulte du melange de deux distributions : I'une sans 
determinant hereditaire (tumeurs sporadiques sans composante familiale) (95%), I'autre en rapport 
avec un allele de predisposition, autosomique dominant, de faible frequence, a penetrance elevee 
(5%). Les genes BRCAl et 2 ont ete clones en 1994 et 1995. 

Le gene BRCA 1 et BRCA 2 provoquent des mutations inactivatrices a I'etat heterozygote sur le gene 
suppresseur de tumeur. II peut y avoir des mutations somatiques exceptionnelles dans le as de 
tumeurs sporadiques. 




Genetique et ethique 
a. Cadre de definition 


La genetique questionne I'ethique : de part les applications croissantes en genetique humaine et 
mediale, la question de la societe et de la manipulation genetique mais aussi la religion, la question 
de la vie et de sa manipulation. 

L'intervention sur le patrimoine genetique se base sur le sequen^age et le dechiffrement du genome 
humain pour peut etre ensuite offrir des therapies geniques et une medecine predictive avec peut 
etre un effet anxiogene mais aussi une future discrimination par les employeurs et assureurs. II y a 
aussi un risque d'eugenisme (attitude philosophie ou theorie qui preconise une amelioration du 
patrimoine genetique de certaines populations humaines par la selection, par ^interruption de la 
grossesse, par I'interdiction de la reproduction des individus consideres comme inferieurs ou meme 
par elemination). 

L'ethique est la partie de la philosophie qui envisage les fondements de la morale. C'est I'ensemble 
des principes moraux qui sont a la base de la conduite de quelqu'un. La demarche ethique se 
distingue de la demarche scientifique qui elle se base sur des jugements de fait formules dans des 
enonces descriptifs. 

^Quelle difference entre morale et ethique ? 

Mores signifie « moeurs » en latin. Ehtos signifie « moeurs » et Ethos signifie « maniere d'etre » en 
grec. Cette distinction est a I'origine de la distinction entre morale et ethique. La morale est basee 
sur des normes et des principes generaux, universalisables, variables en function des cultures. Elle 
determine le bien et le mal. L' ethique est necessaire face a une situation medicale problematique 
singuliere lorsque ni la loi, ni la deontologie, ni la science ne peuvent proposer de reponses simples. 
Elle est une reflexion, a plusieurs, recherchant le moindre mal pour le sujet malade. 

L'ethique recherche le bon, le bien, le juste, le souhaitable, le moins pire. Elle se pose la question de 
que faire, pour bien faire, comment et pourquoi ? Elle agit par recommandation et obeit a un 
imperatif hypothetique c'est-a-dire selon les circonstances. 

La morale determine le bien et le mal et se pose la question de que dois-je faire ? Elle agit par 
obligation personnelle et collective. Elle obeit a un imperatif categorique et s'applique 
necessairement et de maniere universelle le plus souvent. 

Le droit determine le legal et I'illegal et se pose les questions de savoir comment eviter et juger les 
conflits et societes ainsi que de savoir comment proteger le faible du pouvoir. II agit par contrainte, 
protection et sanction. II s'applique de maniere homogene sur tous les citoyens et offre une 
possibilite de jugement singulier par les juges. 

II est necessaire de faire des distinctions parmi les interactions entre ces termes : trahir son ami est 
egal mais pas ethique, deroger a la loi est parfois ethique (lois du parti national-socialiste). Le droit 
peut engendrer des comportements ethiques. La loi peut reposer sur des reperes ethiques (GPA). 

L' ethique permet de reflechir a nos actions de fa^on responsable, aux principes, aux valeurs qui les 
fondent et aux resultats esperes. Les emotions et les vertus participent de la reflexion ethique qui est 
une reflexion integrative des differentes morales. Elle permet de : 

Arracher a I'immediatete de I'appreciation des situations 

Amener a prendre du recul par rapport a une affectivite plus ou moins impulsive 

Attirer I'attention sur les consequences proches ou lointaines de ses actes 





Proposer une hierarchie des valeurs 

L'ethique se decline de la reflexion sur les concepts fondamentaux a la demarche pratique. 

b. L'ethique de la medecine 

L'ethique de la medecine a pour themes, selon Les fondements philosophiques de l'ethique medicale 
par Suzanne Rameix, la procreatique (technoscience du debut de la vie), ^experimentation sur 
I'homme (recherche clinique), I'intervention sur le vieillir et le mourir (soins palliatifs et legislation 
sur la fin de la vie), les greffes d'organes et I'utilisation de parties du corps humain, le cerveau et les 
manipulations de la personnalite, les interventions sur le patrimoine genetique. 

Par exemple, le sequen^age des genomes pose des questions ethiques : certes on peut identifier 
toutes les mutations et genes de predisposition mais cela pose un probleme de diagnostic predictif 
avec un sequen^age systematique des nouveau-nes et un bousculement des normes de bonne 
pratique de genetique internationales. Que faire une fois les informations connues ? Y'a-t-il un risque 
d'eugenisme ? 

c. La genetique medicale 

La genetique medicale constitue en le diagnostic clinico-biologique autour d'une maladie genetique 
mais aussi de nombreux aspects faisant intervenir l'ethique : prise en charge du patient, soutien 
familial, conseil genetique, depistage familial, diagnostic prenatal, diagnostic pre symptomatique. 
C'est la discipline concernee par les maladies genetiques, en particulier dans leur dimension 
familiale. 

Quelques articles de loi pour le depistage familial 

« Lorsque I'examen requiert d'etudier les caracteristiques genetiques d'un ou plusieurs 
membres de la famille, il appartient a la personne concernee, sur les conseils du medecin 
prescripteur, d'obtenir le consentement de chacun d'eux. Ce consentement est donne par ecrit » 

Code de la sante publique, Article R1131-5 

« Nul ne peut faire I'objet de discriminations en raison de raison de ses caracteristiques 
genetiques » 

Code Civil, Article 16-13 

« Les entreprises et organismes qui proposent une garantie des risques d'invalidite ou de 
deces ne doivent pas tenir compte des resultats de I'examen des caracteristiques genetiques d'une 
personne demandant a beneficier de cette garantie, meme si ceux-ci leur sont transmis par la 
personne concernee ou avec son accord. En outre, ils ne peuvent poser aucune question relative aux 
tests genetiques et a leurs resultats, ni demander a une personne de se soumettre a des tests 
genetiques avant que ne soit conclu le contrat et pendant toute la duree de celui-ci. » 

Code de la Sante Publique, Article 1141-1 

« En cas de diagnostic d'une anomalie genetique grave, le medecin informe la personne ou 
son representant legal des risques que son silence ferait courir aux membres de sa famille 
potentiellement concernes des lors que des mesures de prevention ou de soins peuvent etre 
proposees a ceux-ci. Toutefois, si elle estime ne pas etre en mesure d'informer les membres de sa 
famille, elle peut demander par un document ecrit au medecin prescripteur de proceder a la 
transmission. Le medecin porte alors a la connaissance des membres de la famille dont il a re^u les 




coordonnees I'existence d'une information medicale a caractere familial et les invite a se rendre a 
une consultation de genetique, sans devoiler le nom de la personne ayant fait I'objet de I'examen, ni 
I'anomalie genetique, ni le risque qui lui est associe. » 

Code de la Sante Publique, Article L 1131-1-1 

3 possibilites pour la personne diagnostiquee : elle informe directement sa famille, elle I'informe 
indirectement via la procedure de I'information medicale a caractere familial de maniere anonymisee 
ou elle refuse d'informer sa famille. Ce refus sera note et la responsabilite civile de la personne peut 
etre engagee en cas de proces. 

L'interet du diagnostic genetique est d'etablir un pronostic evolutif ainsi qu'une prise en charge et un 
suivi specifique, une surveillance du risque des complications et I'apparition de formes syndromiques 
liees a des anomalies associees. Le diagnostic permet de produire un conseil genetique avec un 
diagnostic prenatal/preimplantatoire et un diagnostic familial. 

II existe des tests genetiques en acces libres, des autotests via internet mais ceux-ci sont caracterises 
par I'absence d'encadrement medical (indication, interpretation), I'absence d'encadrement ethique 
et juridique (identite, consentement, mineur) et I'absence d'encadrement technique (fiabilite, 
qualite). Des exemples de tests genetiques en acces libre : des tests pour les maladies 
multifactorielles, des tests de paternite, filiation, appartenance a un groupe ethnique, identification 
des personnes, sexe foetal, caracteristiques physiques...etc. Des noms comme Navigenic, deCODEme, 
Human Molecular Life Science ou encore Lab Genetics ressortent souvent. 

Le diagnostic presymptomatique est en question avec celle de I'etique. 

L'etude du genome par la biologie moleculaire permet de connaitre le statut d'un individu vis-a-vis 
d'une maladie encore non declaree. Sont concernees les personnes a risque (famille comportant des 
sujets atteints, majeurs, asymptomatiques, faisant une demarche volontaire. 

2 situations de tests : pour des affections pouvant beneficier d'une prise en charge preventive et/ou 
curative (cancers) et des affections sans prise en charge preventive et/ou curative (maladies 
neurodegeneratives. 

Le diagnostic pre-symptomatique est une activite regie par le decret 2000-570 du 23 juin 2000. II fixe 
les conditions de prescription et de realisation des examens des caracteristiques genetiques d'une 
personne. Les DSP doivent etre effectuees par des equipes pluridisciplinaires declarees au ministere 
reunissant des competences cliniques et genetiques avec un certain type de prise en charge qui suit 
une declaration au ministere de la sante. Le DSP est interdit chez le mineur sauf raison 
exceptionnelle. II ne doit pas etre fait dans des situations d'urgence. Le DSP se fait avec 
I'accompagnement d'un proche. 

Les inconvenients du DPS sont: des consequences psychologiques (augmentation de I'anxiete, 
sentiment de culpabilite, alteration de I'image de soi, modification de I'attitude parentale), des 
consequences sociales (discrimination a I'assurance, au travail et au projet de vie) et le fait de 
trouver des maladies a expressivite variable. 

Les avantages sont en cas de test negatif de lever une incertitude, diminuer I'angoisse et I'anxiete, de 
faire une action de prevention et de ne pas subir de discrimination. 




Le test genetique chez un mineur doit etre fait sur la demande des parents car le sujet n'est pas assez 
informe, on considere qu'il n'est pas consentant et le test ne vient pas de son libre arbitre. Sur des 
mineurs symptomatiques, on effectue des tests genetiques a visee diagnostique : fraX, 
mucoviscidose, myopathie, DMD, Steinert, SMA, CMT, Huntington...On a alors un benefice 
diagnostique. Sur un mineur asymptomatique on realise des tests pour evaluer le risque la 
probabilite de I'expression d'une maladie genetique connue dans la famille et sur un enfant a risque 
ou une mutation familiale identifiee. Les tests a ne pas effectuer chez un mineur asymptomatique 
sont les maladies genetiques graves de revelation tardive : maladies neurodegeneratives, 
predispositions hereditaires au cancer, test de recherche de sujet porteur caractere recessif, test 
d'heredite multigenique ou poly factorielle. 

Chez I'enfant, le benefice medical individuel de tests genetiques permet la prevention et la prise en 
charge adaptee pour chaque maladie et chaque enfant. Le test negatif permet d'eviter des 
investigations de surveillance et le test positif permet une surveillance adaptee et un traitement 
preventif. 

Quelques questions autour de la realisation d'un test genetique chez le mineur: 

D'un point de vue ethique, il y a une privation du droit de ne pas savoir et un non-respect de la 
confidentialite. D'un point de vue psychologique il y a une perturbation de la relation parents/enfant 
et une anxiete autour de I'anticipation de la maladie. D'un point de vue legal, I'interet de I'enfant 
doit primer sur celui des parents. 

d. La procreatique et le diagnostic prenatal (DPN)/ Diagnostic pre-implantatoire (DPI) 
i. DPN, DPI, eugenisme et trisomie 21 

La procreatique interroge le statut de I'embryon qui n'est « ni chose ni personne » ou « personne 
potentielle ». Elle interroge le statut du corps et sa disponibilite : corps machine chez 
Descartes/corps propre ou corps vecu/Chair, monisme des phenomenologues. C'est une discipline ou 
il y a un risque de discrimination et d'eugenisme : DPN avec selection des embryons non souhaite. 
C'est une discipline qui questionne la finalite de la medecine : guerir, soigner ou intervenir pour des 
convenances personnelles ? 

Le diagnostic prenatal est encadre par des lois : 

« Lorsque I'interruption de grossesse est envisagee au motif qu'il existe une forte probabilite 
que I'enfant a naitre soit atteint d'une affection d'une particuliere gravite reconnue comme 
incurable au moment du diagnostic, I'equipe pluridisciplinaire chargee d'examiner la demande de la 
femme est celle d'un centre pluridisciplinaire de diagnostic prenatal. » 

Code de la Sante Publique, Article L2213-1 

Ilya des limites au diagnostic prenatal : il est tres anxiogene, il y a un risque de fausse couche lie aux 
prelevements, il n'apporte pas parfois la solution, il n'y a pas de DPN possible pour toutes les 
pathologies/anomalies du developpement mises en evidence, il est le plus souvent non curatif avec a 
la fin une interruption medicalisee de grossesse (IMG) et possede une variabilite d'expression et de 
penetrance. 




Le diagnostic pre-implantatoire est un diagnostic sur une ou deux cellules d'une maladie genetique 
afin de ne transferer dans I'uterus maternel que les embryons reconnus indemnes. Le DPI evite 
eventuellement une IMG mais s'expose aux risques et aleas de la FIV (fecundation in vitro). Le DPI est 
indique en cas d'antecedents du couple avec de multiples IMG sans enfant sain, en cas de genopathie 
a heredite autosomique dominant a expression intrafamiliale tres variable ou a revelation tardive ou 
dans le cas d'une necessite de recours a la FIV pour le couple et dans le cas d'une indication a DPN. 

A noter que les tests prenataux pour maladies communes multifactorielles sont interdits 

L'eugenisme peut etre designe comme « I'ensemble des methodes et pratiques visant a ameliorer le 
patrimoine genetique de I'espece humaine. II peut etre le fruit d'une politique deliberement menee 
par un Etat et contraire a la dignite humaine. 

Les anomalies chromosomiques concernent 0,6% de la population (1 naissance/200), 25% des morts 
neonatales precoces et 10% des produits de fecundation pour ensuite 70% d'avortement spontane 
avant la 6®"^® semaine. 

La trisomie 21 correspond a 1/2000 naissances vivantes en France. File se caracterise par la presence 
de 3 alleles sur le chromosome 21. Les symptomes sont une deficiens intellectuelle variable, souvent 
legere, une hypotonie msuculaire et laxite articulaire quasi constantes, fentes palpebrales en haut et 
en dehors, epicanthus, nuque plate, visage rond, nez petit, pli palmaire unique bilateral. Les 
principales malformations et complications sont: cardiaques et digestive, maladie de de 
Flirschsprung, petit taille, syndrome de West, epilepsies, leucemies, apnees du sommeil, deficits 
sensoriels, pathologies auto-immunes et endocriniennes, vieillissement precoce et maladie 
d'Alzheimer. L'esperance de vie mediane est aujourd'hui superieur a 50 ans. 

ii. DPNI: Depistage prenatal non invasif 

En 1997, on decouvre que I'ADN foetal libre circule dans le sans maternel. II provient des cellules 
trophoblastiques (couche cellulaire qui fournit les nutriments a I'oeuf et apparait au 6®™® jours apres 
fecundation) en apoptose (mort cellulaire programmee) qui sont relarguees de maniere continuelle 
dans la circulation sanguine maternelle. L'ADN foetal libre apparait done de maniere precoce mais se 
trouve en quantite faible. 

On peut alors trouver le genome foetal entier dans cette circulation. L'ADN foetal et I'ADN maternel 
est similaire. On va done comparer les ADN en mettant en evidence une sur-representation d'ADN 
circulant lorsque le foetus est porteur d'une aneuploidie (cellule contenant un nombre anormal de 
chromosomes). Le sequen^age a haut debit des sequences foetales et maternelles de I'ADN circulant 
va permettre de calculer une perte ou un exces de sequence par rapport a un groupe controle 
euploide (contraire aneuploide). La puissance de discrimination augmente avec le nombre de 
molecules d'ADN sequencees. 

e. Le clonage et la modification genetique 

Les animaux d'un clone realises par transferts de noyaux provenant d'un meme individu, ont le 
meme genotype. Ils sont de meme sexe et presentent des caracteristiques physiologiques et 
morphologiques identiques : caracteres sanguins et immunologiques...ou tres proches, taille, poids. 
Les variations constatees entre individus sont tres informatives car elles permettent de determiner si 
un caractere phenotypique ne depend que de facteurs genetiques. Par exemple les taches 
pigmentaires dorsales du pleurodele semble dependre de facteurs epigenetique. La taille et poids 
resultent de Faction des facteurs d'environnement. 





Le clonage necessite I'utilisation de noyaux provenant d'embryons tres jeunes ou de noyaux 
differencies reprogrammes. Son application aux mammiferes fut realisee en tenant compte de ces 
imperatifs et apres adaptation de la technique. 


Le 1®'' clonage reussi chez un mammifere en utilisant des noyaux de cellules d'adultes, fut realise chez 
le mouton. « Dolly » fut obtenue en 1997 par greffe de noyaux de cellules de glandes mammaires. 

Ces cellules furent mises en culture en milieu depourvu de serum : c'est un milieu appauvri. Leurs 
noyaux passent ainsi hors cyle de division. Apres greffe, ils pourront, par cette reprogrammation, se 
synchroniser avec le cytoplasme des ovocytes dans lesquels ils seront greffes et se comporter comme 
des noyaux de fecundation. Au total 277 transferts de noyaux furent effectues, 19 blastocystes 
implantes, 1 embryon viable obtenu qui deviendra la brebis « Dolly ». Cette technique a ete reutilisee 
pour des singes. 

Elle a meme ete utilisee en implantant des fibres de cerveaux malades humains pour que les clones 
developpent les maladies et que nous puissions les etudier. Ainsi on peut constituer des groupes 
controles dont la variabilite genetique est moindre, done moins d'animaux sont necessaires. Les 
cerveaux des primates sont utilises pour etudier les troubles psychiatriques humains et les maladies 
neurodegeneratives comme Alzheimer et Parkinson. 

CRISPR Cas9 est un systeme de defense des bacteries centre les infections virales. Le systeme ARN- 
proteines CRISPR Cas9 reconnait, ouvre et coupe I'ADN viral et elimine I'ADN viral. En genetique, ce 
systeme est utilise pour modifier le genome. 



YAY. 


L'ARN guide (ARNg) comprend I'ARNcr (ARN cripsr) qui cible le locus desire par complementarite des 
bases et I'ARNtracr (trans-activating RNA) qui permet le recrutement de la Cas9. La Cas9 est une 
nuclease qui effectuera une double coupure trois nucleotides en amont de la sequence PAM 
(Protospacer Adjacent Motif). Elle effectue ces coupures grace a deux sous-unites catalytiques 
independantes quji sont HNH du cote de fixation de I'ARN guide et RuvC du cote oppose. 

A la suite de I'induction d'une cassure double brin par le systeme CRISPR-Cas9, il peut y avoir 
reparation par NHEJ (Non-Homologous End-Joining) s'il n'y a pas de matrice de recombinaison. Cela 
peut induire le KO du gene par Insertions/deletions. 

Si une matrice de reparation est apportee, il va y avoir insertion de la matrice grace a ses regions 
d'homologie, par le mecanisme de Recombinaison Homologue. 
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f. Les experimentations sur I'homme 


Les essais cliniques doivent etre soumis pour approbation au Comite de protection des personnes 
(CPP) depuis la loi Huriet (1988) puis Jarde (2012). Le consentement doit etre libre et eclaire. L'essai 
sans benefices doit etre justifie. Ilya des experimentations sur les mineurs et sur les patients 
proteges (curatelle, tutelle et personnes privees de libertes. Ilya forcement un groupe sous placebo 
pour un groupe controle. 

Comment marche le clonage ? On va prelever une cellule totipotente (cellule embryonnaire encore 
indifferenciee), le noyau va etre transfere dans un ovocyte, on va alors avoir une cellule pluripotente 
(capacite d'une cellule a se differencier en trois feuillets embryonnaires (etats embryonnaires) ou 
cellules germinales) qui va finir par se differencier. La differenciation depend de facteurs 
epigenetiques notamment. On parle alors de reprogrammation cellulaire. 

En Chine, un chercheur a manipule le genome d'un embryon pour qu'il ne puisse pas avoir le SIDA 
plus tard (sachant qu'un des parents I'a eu). II a inactive le gene CCR5 qui encore un recepteur que le 
HIV utilise pour penetrer les cellules. 

Cours 8 : Les faux-semblants 


1. Evaluation statistique de la similarite et de la difference 
a. Metrologie 

La metrologie est la science des mesures, c'est I'ensemble des techniques permettant d'evaluer des 
grandeurs, des performances 

Une mesure (resultat obtenu) est le resultat du mesurage (action de mesurer, par exemple, doser 
le taux de glucose) d'un mesurande (la grandeur mesuree, par exemple, la glycemie) 


La mesure donne un nombre avec une unite. On connait les incertitudes de la mesure. L'objectif est 
done d'obtenir des mesures fiables e'est-a-dire avec un niveau de confiance eleve. 

^Quels sont les criteres de validation des methodes de mesures ? 

Fidelite : caracteristique d'une methode donnant toujours le meme resultat ou des resultats voisins 
si elle est repetee sur le meme echantillon 

Repetabilite : fidelite sous des conditions de repetabilite (meme methode, laboratoire, operateur, 
equipement et pendant un court intervalle de temps) 

Reproductibilite : fidelite sous des conditions de productibilite (meme methode dans differents 
laboratoires, operateurs, equipements) definies selon les textes de references, en admettant la 
possibilite de conditions de travail differentes. 

Justesse : etroitesse d'accord entre le resultat d'une mesure et la valeur attendue (cible ou valeur 
reputee vraie. 

^Comment representer les criteres de fidelite et de justesse sous forme schematique ? 

Une cible dont le centre represente la valeur attendue de la mesure et dont les tirs representent les 
resultats de differentes mesures (en conditions de repetabilite ou de reproductibilite) peut 
representer ces criteres. 
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l=Des tirs eloignes du 
centre et non groupes 
represente une mesure non 

fidele et non juste. 

2=Des tirs eloignes du 
centre et groupes 
represente une mesure 
fidele mais non juste. 

3=Des tirs proches du 
centre et non groupes 
represente une mesure non 
fidele mais juste. 

4=Des titres proches du 
centre et groupes 
represente une mesure 

fidele et juste. 

^Quelles sont les limites d'une mesure ? 

La sensibilite designe le rapport entre la variation instrumentale et la variation de la mesurande. 
Cette sensibilite peut donner des mesures differentes et reduire la fidelite et la justesse. 

La limite de detection designe la plus petite quantite ou centration distinguable d'un « blanc » (c'est- 
a-dire la plus petite quantite mesurable que I'on peut distinguer de rien). 

La limite de quantification designe la plus petite quantite ou concentration pouvant etre mesuree 
avec un risque d'erreur connu. 

b. Variabilite technique et biologique 

On mesure la variabilite technique a partir d'un sujet a partir duquel on fais plusieurs tests et on 
mesure la variabilite biologique a partir de plusieurs sujets qui subissent un test chacun. Dans le cas 
de la variabilite technique on cherche a determiner la justesse et la fidelite d'un instrument 
technique. Dans le cas de la variabilite biologique on cherche a determiner la justesse et la fidelite 
d'une mesure biologique. 

Dans le cas de la variabilite technique, la mesure repetee sur un meme echantillon donne rarement 
deux fois exactement le meme resultat. Si on trace sur un histogramme la frequence des resultats en 
function des valeurs obtenues pour classer les differences mesures on obtient en general un modele 
en forme de « cloche » que I'on peut representer ainsi : 
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On dit que les mesures suivent le modele de Gauss. Dans un nombre infini de mesures (n) sur le 
meme echantillon biologique et dans les memes conditions experimentales, la serie de resultats avec 
des frequences variables suit une repartition selon la loi Normale de Gauss. 

Friquence t 


La loi normale de Gauss (dont les caracteristiques seront etudiees au point suivant) est une loi de 
probabilite dans laquelle les mesures sont des variables aleatoires notees ici Xi pouvant prendre 
toute une serie de valeurs non previsibles. 

Deux courbes qui correspondent a deux series de mesures de deux echantillons biologiques peuvent 
donner un recourbement, c'est-a-dire un chevauchement des courbes. En comparant les moyennes 
(ci-dessous rrii et m 2 ) on peut conjecturer s'il existe une variation significative en fonction des 
valeurs. 

Par exemple, si on mesure la taille des filles et des gardens d'un groupe et qu'on represente les 
resultats sous forme de courbes, on va avoir peut-etre un recourbement. Dans ce recourbement (que 
I'on peut representer ci-dessous en bleu) on aura des filles ET des gardens qui font environ la meme 
taille. Dans cet intervalle il n'y a done pas de variation signification en fonction des valeurs. Si on 
regarde les moyennes il y a plus de chances qu'il existe une variation significative des valeurs. 



Distribution dc n resultats 
Selon la loi Normale de Gauss 


valeurs das 
masurts xi 
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c. Comparaison de moyennes 
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En comparant deux groupes 
de mesures et leurs 
moyennes sur un graphique 
de « nuage a points », on 
peut remarquer une 
variabilite de resultats 
differentes. Ci-dessous on 
peut voir que la mesure 2 a 
moins de variations que la 
mesure 1 en orange car la 
mesure 2 a un groupe plus 
rapproche de sa moyenne 
que la mesure 2 qui a un 
groupe plus disperse. 


Pour mesurer la dispersion de part et d'autre de la moyenne il faut mesurer I'ordre de grandeur des 
valeurs par rapport a la moyenne. 

La variance est la moyenne des carres des ecarts a la moyenne. Elle est representee sous la 
Kx-IQ^ 

formule simplifiee: avec S qui est le symbole de la somme : on a done somme des ecarts 

(x) a la moyenne representee par le symbole x divises par (n) I'echantillon. C'est done bien la 
moyenne des carres des ecarts a la moyenne. 

L'ecarttype est la racine carree de la variance. Elle est representee sous la 


Barplot 




formule : et sous le symbole sigma a. 

L'ecart type mesure la dispersion autour de la moyenne. L'ecart type et la 
deviation standard (ou standard deviation en anglais) sont des 
synonymes. 


L'erreur standard (ou en anglais standard error, SE, Standard Error of the 
Mean, SEM) est une estimation de l'ecart type lie a l'erreur de la mesure. 
L'erreur standard est consideree comme l'ecart type de la distribution 
theorique de toutes les erreurs qui seraient commises au cours des 
mesures. Cette distribution des erreurs est estimee normale(gaussiene). Si 
le paramMre ou la statistique est la moyenne on parle d'erreur standard 
de la moyenne. C'est l'ecart-type de la distribution d'echantillonnage de la 
moyenne. 
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L'erreur standard de la moyenne d'une population est egale a son ecart type divise par la racine 

<j 

■yjn 

carree de I'effectif tel que 

Lorsque Ton veut decrire la dispersion d'une valeur dans une population on utilisera done 
preferentiellement I'ecarttype ou deviation standard. Lorsque I'on veut rapporter une mesure que 
I'on a repete pour verifier sa validite, on utilisera preferentiellement l'erreur standard. 

Sur un graphique, on peut representer l'erreur standard par des intervalles de confiances a 95% qui 
estiment l'erreur de la mesure (voir graphique ci-dessus page precedente et cercle rouge) 


^Quelles sont les caracteristiques d'une courbe de Gauss 

rvT) 



Une courbe de Gauss est une distribution de courbe en cloche. Elle presente les effectifs maximums 
aux alentours de la moyenne et on observe une decroissance symetriquement de chaque cote. La 
moyenne m partage symetriquement la courbe en cloche. La mediane est la valeur qui partage la 
population en deux sous populations egales et non equivalente a la moyenne arithmetique si la 
distribution est non gaussienne. La dispersion s ou ecart-type caracterise la plus ou moins grande 
dispersion des valeurs autour de la moyenne m. C'est la mesure de la distance separation le point 
d'inflexion au trait m. Plus I'ecart type est grand, plus la dispersion est grande. A noter que la 
moyenne est aussi notee mu p. 

Environ 68% des mesures sont comprises dans I'intervalle m ± a e'est-a-dire I'intervalle [p- a; p+ a] 


fvn 



65 % 
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Environ 95% des mesures sont comprises dans I'intervalle m ± 2a c'est-a-dire I'intervalle [p- 2a; p+ 
2a] 





Environ 99,8% des mesures sont comprises dans I'intervalle m ± 3o c'est-a-dire I'intervalle [p- 3a; p+ 
3a] 

I'intervalle de confiance a 95% est un intervalle de valeurs qui a 95% de chance de contenir la vraie 
valeur du parametre estime. 

d. Intervalle de confiance 

I'intervalle de confiance mesure le degre de precision que I'on a sur les estimations issues de 
I'echantillon. II y a deux sources principales de variations sur les donnees qui peuvent etre la cause 
d'un manque de precision dans I'estimation d'une grandeur: 

Un nombre insuffisant de donnees : dans le cas d'un sondage, on ne sonde qu'une fraction 
de la population. Dans les mesures physiques, on n'effectue qu'un nombre fini de mesures 
alors qu'il faudrait souvent en theorie pouvoir en faire une infinite pour obtenir un resultat 
parfait. 

II peut egalement y avoir du bruit dans la mesure des donnees, ce qui est pratiquement 
toujours le cas pour la mesure des grandeurs physiques. Un bruit de mesure est un signal qui 
vient perturber la mesure : il peut etre d'origine naturel (parasites atmospheriques 
(rayonnements electromagnetiques par exemple), solaires, cosmiques) ou artificiel (parasites 
industriels). 

II. Reflexions autour de la correlation et du lien de causalite 
a. Correlation et regression 

La correlation cherche a mesurer la force, la rigidite de la liaison statistique entre X et Y. Si cette 
liaison est rigide, il sera en particulier possible d'avoir une bonne idee de Y en connaissant seulement 
X et vice versa. 

Exemple : s'il existe une bonne correlation entre la taille d'une dent et la taille de son 
proprietaire chez les tyrannosaures, alors il est possible de deduire de maniere approximative la taille 
d'un specimen fossile dont on a juste retrouve une dent et reciproquement. 
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La regression (lineaire) cherche a caracteriser la pente de la droite pouvant resumer au mieux la 
relation entre X et Y une fois choisies des unites de mesures pour X et Y. 

Exemple : Si la dose efficace d'un anesthesique est 5mg/kg de poids de corps, on note une 
pente de 5 pour 1 avec ces unites-la. Un gain de poids de 10kg chez un patient obligera pour le meme 
effet anesthesique a augmenter la dose de 10*5=50mg. 


La pense en question n'a d'interet que si la relation entre la dose efficace et I'effet est suffisamment 
rigide. Si cette relation est en realite tres floue. Le risque de sous-doser ou de sur-doser 
I'anesthesique devient inquietant. D'ou I'interet de connattre la force de la liaison en plus de sa 
pente. 

La correlation et la regression poursuivent le meme but: caracteriser la liaison statistique entre deux 
variables quantitatives. Correlation et regression permettent toutes deux de repondre aux questions 
« Y'a-t-il un lien statistique entre X et Y ? » et « Quelle est la force de ce lien eventuel (correlation) et 
quelle est la pente de la relation eventuelle pour un jeu d'unites donne (regression) ? » 


Tableau recapitulatif: 


Correlation 

Regression 

« Y'a-t-il un lien statistique entre X et Y ? 

« S'il existe, quelle est la rigidite de ce lien ? En 
particulier quelle est la fraction de la variance 
de Y qui subsiste si je fixe X ? » 

« Quelle est la relation numerique entre X et Y 
pour un jeu d'unites donnees (si X vaut « telle 
valeur » dans les unites choisies pour exprimer 

X, quelle sera en moyenne la valeur de Y dans 
les unites choisies pour exprimer Y ? 

Test du coefficient de correlation (CC) 

Test de la pente 

^ Si le coefficient de correlation est significatif, 
alors : 

II existe un lien. La encore, impossible de 
determiner la nature du lien sur la seule base du 
test, sauf dans le cas experimental ou I'on 
conclurait a un lien causal. 

La valeur du CC note R et du coefficient de 
determination (CD) note R^ ont un sens, et 
permettre de repondre a la question 
precedente. 

^Si le test de la pente est significatif, alors : 

II existe un lien, mais un test significatif est a lui 
seui insuffisant pour demontrer que c'est X qui 
agit sur Y, sauf dans une situation experimentale 
dans laquelle tous les facteurs sont strictement 
controles et que I'experimentateur fait varier X. 
Le calcul de la {'equation de la droite de 
regression est justifie et permet de repondre a la 
question precedente. Le calcul de CC permet de 
connaTtre la force du lien entre X et Y. 

^Si le CC ou le teste de la pente ne sont pas significatif, alors : 

Soit le lien existe mais il n'y avait pas suffisamment de donnees pour le mettre en evidence. 
Soit le lien n'existe pas. 


La correlation entre deux variables quantitatives X et Y est I'existence d'une liaison statistique entre 
elles, quelle qu'en soit la raison. « Liaison statistique » signifie ici que les deux variables ne semblent 
pas varier independamment I'une de I'autre : connaTtre la valeur de la variable X ou Y pour un 


individu fournit une information sur sa valeur pour la variable Y ou X. 

L'existence d'une liaison statistique ne signifie pas necessairement I'existence d'une liaison causale 
(c'est-a-dire un lien de cause a effet, une action de X sur Y ou inversement). Si une liaison statistique 
est decelee entre deux variables, I'existence d'une liaison causale directe entre elles sera seulement 
une des possibilites a explorer. La confusion entre « X et Y sont correlees significativement » et « X a 
un effet sur Y (ou inversement) » est probablement une des erreurs les plus communes de toute 
I'analyse des donnees. 
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b. Notion de covariance 


En statistiques lorsque deux variables evoluent dans le meme sens, on dit qu'elles covarient de 
maniere positive. 

Exemple : Taille et longevite des mammiferes varient globalement dans le meme sens, les 
especes de grande taille vivent en general plus longtemps que les especes de petite taille. Mais 
attention, il n'y a aucun lien de cause a effet, de causalite entre taille et longevite : faire plus d'lmSO 
ne va pas faire vivre plus longtemps 

Lorsque deux variables evoluent dans un sens contraire I'une par rapport a I'autre, on dit qu'elles 
covarient de maniere negative. 

Exemple : Plus une espece d'oiseau a une vitesse de croisiere elevee, plus son rythme 
cardiaque au repos est lent. 

Une covariance negative peut demontrer une correlation, meme si negative. Sur notre exemple 
precedent, si I'on raisonne a I'echelle de I'espece, cette relation paradoxale a priori s'explique car les 
especes qui volent vite sont en general de grande taille alors que les especes de petites tallies volent 
assez lentement. Les grands animaux ont des rythmes cardiaques bien plus lents que les petits. 
Cependant, cela ne montre pas un lien de causalite ou de cause a effet : la vitesse en vol ne peut 
influencer le rythme cardiaque au repos et inversement car ce sont deux etats differents. 

Lorsque deux variables sont a priori totalement independantes I'une de I'autre on dit que leur 
covariance est nulle. 

Exemple : Le lien entre le taux d'accident du Tram B entre Saint Nicolas et Peixotto par jour 
et la prise d'anti-depresseurs quotidienne dans une zone englobant les quartiers Saint Nicolas et 
Peixotto. 


c. Notion de coefficient de correlation 

Le coefficient de correlation de Pearson est con^u pour mesurer precisement la liaison statistique 
entre deux variables qui evoluent proportionnellement I'une par rapport a I'autre et qui le font de 
maniere constante/monotone. Le coefficient de correlation invente par Karl Pearson est designe par 
la lettre R et se calcule de cette maniere : 


cov(Z, Y) 

{sX X 57) 

Avec X et Y, deux variables, cov la covariance estimee a partir des donnees et sX et sY les ecarts- 
types des variables X et Y estimes a partir des donnees. 

Dans sa forme plus « mathematique » : 

p, ^ Er=i(^< -x)(yi-y) 

- vY 

Tel que la covariance se calcule comme la variance de X multipliee a celle de Y (formule vue 
precedemment). 
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d. Correlation, cause, effet, multicausalite 


« Correlation n'est pas raison » est un diction statistique important. II rappelle que le fait de trouver 
une correlation meme elevee et hautement significative entre la deux variables X et Y ne demontre 
pas du tout qu'il y a un lien de cause a effet entre X et Y et inversement. 

Dans une situation d'observation (c'est-a-dire en dehors d'un dispositif experimental dans lequel 
tous les facteurs sont strictement controles), si on constate une forte correlation entre deux 
variables, il faut done imperativement resister a I'envie de proclamer tout de suite un lien de cause a 
effet. 

L'etablissement d'un lien necessite une experimentation en conditions contrdlees ou une 

accumulation d'autres observations dans differentes situations, qui permette d'exclure les autres 

possibilites non causales. 

Un grand classique est la correlation observee systematiquement entre deux variables X et Y 
lorsqu'elles sont toutes les deux influencees par la meme troisieme variable Z. 

Exemple : Le nombre Y de coups de soleil attrapes sur une plage est fortement correlee a la 
temperature moyenne X de fair ce jour-la. X n'influence pas Y. En realite, la variable Z, la quantite de 
rayonnement solaire est causale de la temperature moyenne X de fair et du nombre Y de coups de 
soleil attrapes sur une plage. 

En toute rigueur, une correlation n'est ainsi qu'un indice statistique precisant le degre de liaison 
entre deux variables. Des lors que cette relation est solidement demontree un certain nombre de 
fois, on peut lui donner force de loi. 

On est alors tente d'essayer de la «justifier », de determiner ce qui explique le lien entre les 
phenomenes. L'interet etant de mieux comprendre la relation pour parvenir a mieux predire 
fapparition de fun des phenomenes en fonction de foccurrence d'un autre. 

On peut definir alors la causalite comme elle est definie en sciences physiques : 

« En physique, le principe de causalite affirme que si un phenomene (nomme 
cause) produit un autre phenomene (nomme effet), alors I'effet ne peut preceder 
la cause. L'effet ne peut pas etre en theorie la cause de la cause, mais certaines 
theories envisagent une causalite inversee. 

On comprend que la causalite est le fait que si un phenomene A produire un phenomene B alors A 
est la cause de B et A precede B : B n'existe pas avant A. 

Lorsqu'on observe une correlation entre deux phenomenes A et B, il existe au moins six fa^ons d'en 
rendre compte : 

A est cause deB 
B est cause de A 

A et B ont pour cause un meme phenomene-source C 

A est la cause de C qui est la cause de B ou B est la cause de C qui est la cause de A 
A est la cause de B et dans le meme temps B est la cause de A (les deux phenomenes se 
renforcent entre eux) 

La co-occurrence de A et B est une coincidence 

Les cinq premieres etablissent une causalite, c'est-a-dire un rapport de cause a effet entre les 
evenements A et B dans un sens ou fautre, ou en passant par un intermediaire C. 
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La multi-causalite est le fait d'avoir de multiples liens qui unissent la cause a I'effet. Comme nous 
I'avons vu precedemment, il existe des maladies multifactorielles comme I'obesite. 


On peut devenir obese par la genetique, I'absence d'activite physique, le style de vie, le metabolisme 
basal, I'environnement, les facteurs psychosociaux, la thermogenese adaptative...Ces liens vont unir 
la cause (trop d'energie acquise par rapport a I'energie depensee dans la balance energetique) a 
I'effet (I'obesite). 

Non contents de s'arreter a ^interpretation erronee d'une correlation (elle-meme deja fantasmee ou 
non), certains se permettent d'en deduire des propositions d'action pour remedier a certaines 
situations jugees non desirables. C'est en effet le stade logique suivant le constat d'existence et la 
tentative d'explication : la recommandation d'actions ou de comportements. 

Le lien existe, on sait d'ou il vient, mais qu'en faire ? Le « saut quantique » depuis le stade de la 
comprehension jusqu'a celui de la prescription est loin d'etre anodin, car pas du tout inclus dans les 
faits eux-memes : ici aussi, il n'y a bien qu'un cerveau humain pour imaginer comment passer de I'un 
a I'autre. N'oublions pas que I'Histoire est remplie d'actes issus de processus cognitifs relatifs a I'effet 
Cigogne (confondre correlation et causalite). 


III. Homologie et analogie. La convergence evolutive aux differents niveaux d'integration du 
vivant 

a. Notion d'homologie 

« En biologie, I'homologie designe un caractere propre a plusieurs especes herite d'un ancetre 
common. Les structures en question qu'elles soient d'ordre anatomique, moleculaire ou genetique, 
partagent done une histoire evolutive » 

Les chauves-souris et les hommes partagent des bras, ce sont des caracteres homologues. 
Inversement, deux structures peuvent se ressembler en forme et fonction mais peuvent etre 
apparues independamment dans plusieurs groupes differents. Par exemple : les ailes des oiseaux et 
des insectes. 

b. Notion d'analogie 

L'exemple cite precedemment est un exemple de caracteres analogues. 

« Une analogie est une ressemblance fonctionnelle entre des traits anatomiques chez differentes 
especes. Ils ont generalement la meme fonction biologique, mais en revanche pas obligatoirement la 
meme origine evolutive. Ils ne partagent pas d'ancetre commons. » 

c. Notion de convergence evolutive 

« En biologie de devolution, la convergence ou homoplasie est la presence chez deux especes de 
caracteres analogues, d'une meme adaptation, mais qui n'a pas ete herite d'un ancetre common. Elle 
resulte de deux evolutions independantes dans un meme type d'environnement » 

Par exemple : les cetaces font parti de la classe des mammiferes meme s'ils ressemblent fortement 
aux poissons. Ils ont des evolutions convergentes ayant mene dans les deux cas a une adaptation au 
milieu aquatique. 

Pour ne pas confondre : Un caractere est homologue quand deux especes ont herite de ce caractere 
d'un ancetre common. Un caractere est homoplastique quand deux especes provenant d'un meme 
ancetre common evoluent differemment mais possedent ce meme caractere ne provenant pas d'un 
meme ancetre common. 
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d. Notion de reversion 


« La reversion est, en genetique, plus precisement dans le domaine de la biologie de devolution, le 
retour d'un caractere a un etat primitif se manifestant par une mutation genique dans I'ADN 
permettant de retrouver les fonctions d'un gene apres qu'il les a perdues a la suite d'une premiere 
mutation. [...] II existe deux types de reversion : 

Les reversions vraies : le retour a I'etat initial du gene 

Les reversions fausses : I'etat est different de I'initial mais permet le retablissement de la 
fonction » 

La reversion biologique remet en cause le caractere ineluctable de devolution. 
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